咨询电话
400-123-4567
手 机:13988999988
电 话:400-123-4567
传 真:+86-123-4567
邮 箱:[email protected]
地 址:广东省广州市天河区88号
电 话:400-123-4567
传 真:+86-123-4567
邮 箱:[email protected]
地 址:广东省广州市天河区88号

微信扫一扫
开源全家桶又添一“元”,腾讯混元大模型公布
作者:[db:作者]日期:2024/12/11 17:33浏览:
刚,腾讯混元年夜模子颁布最新停顿:正式上线视频天生才能,这是继文生文、文生图、3D天生之后的又一新里程碑。与此同时,腾讯开源该视频天生年夜模子,参数目130亿,是以后最年夜的视频开源模子。“用户只要要输入一段描写,即可天生视频,”腾讯混元相干担任人流露,现在的天生视频支撑中英文双语输入、多种视频尺寸以及多种视频清楚度。现在该模子已上线腾讯元宝APP,用户可在AI利用中的“AI视频”板块请求试用。企业客户经由过程腾讯云供给效劳接入,现在API同步开放内测请求。经由过程腾讯元宝APP-AI利用-AI视频即可应用该功效(后期需请求)在与海内外多个顶尖模子的评测对照表现,混元视频天生模子在文本视频分歧性、活动品质跟画面品质多个维度后果当先,在人物、天然场合等场景下表示尤为杰出。腾讯混元视频天生年夜模子制造出的视频画质很真切,内容也与提醒词高度分歧,确保画面的流利性,增加形变,乃至在提醒词是 emoji 心情的情形下,也能够稳固输出。比方,在处置冲浪、跳舞等包括年夜幅度举措的场景时,该模子可能天生流利且公道的举措镜头,物体形变景象失掉无效把持;在处置光影反射时,它可能基础遵守物理法则,如在镜面或照镜子的场景中,可能实现镜表里举措的分歧性。别的,该模子还能在坚持画面配角稳定的情形下主动切换镜头,这是很多其余模子所不具有的高等功效。视频由腾讯混元视频天生,提醒词:200mm长焦镜头,瞄准一只停在雕栏上的海鸥。羽毛的纹理清楚可辨,远景的木雕栏温顺虚化。远处的夕阳跟海立体熔化成金白色的光影视频由腾讯混元视频天生,提醒词:狂风雪中,一列蒸汽火车在曲折山间穿行,黑烟从车头直冲云霄,车厢在皑皑白雪中留下深奥轨迹,镜头以正面追踪,捕获机器巨兽破开风雪的澎湃气概,白雾与蒸汽交错成绚丽画卷,片子气氛,前景视频由腾讯混元视频天生,提醒词:一个暗藏的瀑布流入明澈的水池,四周是矮小的树木跟绿色动物。阳光穿过树叶,鄙人面的岩石跟水面上构成雀斑。真切,茂密丛林中的安静瀑布,安静、阳光亮媚的日子,中景视频由腾讯混元视频天生,提醒词:一位戴着复旧飞翔护目镜的机器师,半跪在蒸汽朋克作风的任务室里。她棕色卷发挽成发髻,零碎的银色发丝闪着金属光芒。深棕色皮质工装背带裤上沾满机油污渍,袖口卷起显露充满齿轮纹身的手臂。特写她正用黄铜东西调试一只机器鸟,齿轮间冒出缕缕蒸汽,任务台上散落着铜管、发条跟老式图纸。它采取了与Sora类似的DiT架构,并在此基本长进行了多项优化。混元的视频天生模子经由过程引入新一代的文本编码器,明显加强了对语义的懂得跟遵守才能,这使得它在处置多主体场景时可能愈加准确地履行指令并浮现细节;别的,该模子还采取了同一的全留神力机制,这不只让视频帧之间的过渡愈加天然,还实现了在坚持主体分歧性的条件下停止多视角切换;最后,混元经由过程采取进步的图像视频混杂VAE技巧(3D变分编码器),在细节捕获上获得了明显提高,特殊是在处置小尺寸人脸跟疾速活动镜优等庞杂场景时表示尤为凸起。现在,腾讯发布开源该视频天生年夜模子已在 Hugging Face 平台及 Github 上宣布,包括模子权重、推理代码、模子算法等完全模子,可供企业与团体开辟者无偿使用跟开辟生态插件。基于腾讯混元的开源模子,开辟者及企业无需重新练习,即可直接用于推理,并可基于腾讯混元系列打造专属利用及效劳,可能节俭大批人力及算力,减速行业翻新步调。据雷峰网(大众号:雷峰网)懂得,从年终以来,腾讯混元系列模子的开源速率一直放慢。此前,腾讯混元曾经开源了旗下文生文、文生图跟3D天生年夜模子。至此,腾讯混元系列年夜模子已实现片面开源。雷峰网原创文章,未经受权制止转载。概况见转载须知。]article_adlist-->
申明:新浪网独家稿件,未经受权制止转载。 -->
相关文章
- 2024/12/11开源全家桶又添一“元”,腾讯混元大模
- 2024/12/11历经五年重建,巴黎圣母院将重新开放
- 2018/08/20萎靡的纸箱行情
- 2018/08/20大火烧的很惨!华东一包装厂车间生产线