跳蛋 户外 火山引擎发布大模子侦察视频预惩处有打算,已运用于豆包视频大模子
10月15日,火山引擎在视频云时间大会上发布了大模子侦察视频预惩处有打算,使模子能更高效地学习视频中的特征和常识,普及侦察后果和遵循。现在跳蛋 户外,该时间有打算已运用于豆包视频生成模子。
据先容,对侦察视频进行预惩处是保险大模子侦察后果的进犯前提,不错长入视频的数据款式、提高数据质地、达成数据范例化、减少数据量以及惩处标注信息。抖音集团视频架构负责东说念主王悦暗示,对大模子厂商而言,上述历程中靠近着诸多挑战。“率先,超大范畴视频侦察数据集导致狡计和惩处资本激增,”王悦说,“其次是视频样本数据杂乱不王人,然后是惩处链路才智多、工程复杂,临了还靠近着对GPU、CPU、ARM等多种异构算力资源的颐养部署。”
借助Intel的CPU、GPU等不同资源,火山引擎这次发布的大模子侦察视频预惩处有打算依托于自研的多媒体惩处框架BMF,能灵验吩咐模子侦察的算力资本挑战。此外,该有打算还在算法和工程方面进行了调优,不错对海量视频数据高质地预惩处,短时辰内达成惩处链路的高效协同,提高模子侦察遵循。值得一提的是,火山引擎本次还发布并开源了迁徙端后处意会决有打算BMF lite版块。BMF lite扶持端侧大模子接入和算子加快,愈加轻量、通用。
这次活动中,火山引擎还发布了跨讲话同声复刻直播有打算、多模态视频意会与生成有打算、对话式AI及时交互有打算和AIG3D&大场景重建有打算。比如依托豆包大模子和火山引擎视频云自研的多项算法,火山引擎为用户提供了智能对话和当然讲话惩处的繁多才智,可达成毫秒级东说念主声检测和打断反应,以及丝滑巩固的端到端反应体验。
处女色电影王悦还流露了字节自研视频编解码芯片的最新明白,经过抖音集团里面的实践考证,该芯片在同等视频压缩遵循下,资本简易了95%以上,还在2024MSU寰宇编码器大赛中一举夺得最好ASIC编码器。王悦暗示,该芯片将于近期崇拜对外绽开测试,招募首批种子用户,共同探索交易价值的可复制性。
文/北京后生报记者 温婧
剪辑/田园跳蛋 户外