2月28日,界面新闻从多个知情人士处获悉,字节跳动正在AI大模型领域秘密研发多个产品,其中包括多模态数字人产品以及AI生图、AI生视频产品等。
据一位知情人士透露,其在去年下半年见到了字节跳动多模态数字人产品的demo,整体感觉还不错。
另据界面新闻了解,字节跳动旗下剪映已在数月前组建封闭团队,秘密研发AI产品。目前,该团队仍处于严格保密阶段,研发的产品还未上线。
界面新闻向字节跳动方面求证上述消息。截至发稿,暂未得到回应。
一位接近字节跳动的知情人士称,去年一年,字节跳动创始人张一鸣将全部时间都花在了AI上,足以窥见这家公司对AI业务的重视程度。
目前,字节跳动在AI大模型相关产品的研发上采取从模型层到应用层的全面布局、多条腿走路的模式。
在基础大模型领域,去年8月,该公司上线首个大语言模型“豆包”及多模态大模型BuboGPT。其抖音云雀大模型通过首批《生成式人工智能服务管理暂行办法》备案,面向公众开放。
几天前,字节跳动还发布文生图开放模型SDXL-Lightning,该模型能够在2步或4步内生成极高质量和分辨率的图像,将生成速度加快十倍。
在AI应用层,字节跳动已于去年11月成立了新AI部门Flow,目前已经推出了三款AI对话类产品,包括豆包、扣子和Cici。在基础大模型层,字节跳动在语言和图像两种模态上均进行了布局,两个团队均向TikTok技术负责人朱文佳汇报。
另一位接近字节跳动的人士透露,该公司目前在大模型布局上面临着较大压力,因其去年在自研还是投资问题上出现了战略摇摆。
上述人士称,字节跳动最初准备以投资形式进入大模型领域,一度考虑投资大模型公司MiniMax和阶跃星辰,但在去年6月决定放弃投资外部大模型公司,转向自研。
“在自研上,字节跳动的进步并没有比创业公司快。在投资上,特别是阿里巴巴近期大手笔投资月之暗面之后,字节跳动完全放弃投资的战略选择正确与否还需要重新评估。”上述知情人士表示。
但多位了解字节跳动大模型情况的人士强调,现在不能完全否定其在AI大模型领域的布局。在所有字节系产品中,当下最有希望承接字节跳动AI大模型落地的产品就是剪映。
其中一位知情人士分析称,剪映是一个视频创作工具,处于内容创作的上游,往AI方向走即文生视频。此外,剪映创作的视频内容有抖音承接,创作者后续使用字节系的文生视频、多模态数字人产品创作内容,都有较大的想象空间。
今年春节前,原抖音集团CEO张楠辞任CEO一职,称未来将把精力聚焦在剪映的发展上。这一动作也被诸多业内人士解读为,字节跳动要通过剪映在文生视频方向上发力。
“剪映目前需要先把创作素材的问题解决,包括视频类、动画类等方面的各种个性化素材。”上述知情人士表示。