皮球文章网

手机版

AI能让人类实现永生吗?丨湾流数智先锋

0次浏览     发布时间:2025-05-19 22:00:00    

“AI技术或者模型在某种程度上帮助人类实现永生。”在和趣丸千音营销副总裁邢瑞琪交流的过程中,她的这句话让人印象十分深刻。

前两天,广州趣丸网络科技有限公司(下称“趣丸科技”)入选了2025福布斯中国“人工智能科技企业TOP50评选”。作为本次广州唯一上榜的企业,趣丸科技的AI含金量不言而喻。

趣丸科技的荣誉墙

作为一家生来就带数字化基因的互联网科技公司,谈论“数字化”似乎显得稀松平常。在趣丸科技总裁助理兼公共事务部总经理刘静雯看来,比起数字化,智能化才是接下来要重点布局的方向,“对于中国企业来说,智能化是未来十年最大的增量”。

5年投入19亿元做人工智能等前沿技术研发,趣丸科技现如今构建了全栈式AI交互技术产业生态,在AI语音、AI音乐、数字人等领域开启了“多条腿走路”的模式。这家科技企业的数智化,到底做到哪一步了?

趣丸展位(受访者供图)

短剧出海效率“一泻千里”

国产短剧《我在八零年代当后妈》在春节期间火爆后,变身《Back to the 80s(DUBBED)》登陆点众科技旗下短剧出海平台DramaBox。爽点剧情同样满足了海外用户的需求,但字幕版本有点跟不上了。求西班牙语字幕、印尼语字幕的在评论区比比皆是。

2024年,中国短剧出海市场迎来爆发式增长,总下载量达到3.7亿次,内购收入达到5.7亿美元。美国、印度尼西亚和巴西成为下载量增加的主力军,而美国、日本和澳大利亚则是内购收入的主要来源。

在短剧出海这个圈里,译制剧成为热门载体。为了快速回本,平台恨不得从横店拿到制作方的一部剧三个小时后就能完成翻译并在App上架。但译制过程中的字幕擦除、翻译和配音,一来成本高筑,二来人力译制需要时间。

“在趣丸千音上,同样100分钟到120分钟的剧集,人工译制的成本比AI译制贵15倍以上。从时间维度来看,原先人工每日能处理十几二十集,AI现在基本一天就能翻译完一部剧并且调优,速度也提升了10倍以上。”邢瑞琪表示。也就是说,上午拿到制作好的作品,下午就可以开始在海外投放。

趣丸千音是趣丸科技在今年4月推出的一站式AI语音创作平台,集成文本转语音、视频翻译、多语种合成等多元能力,是业界首个从模型到应用全面赶超国际先进水平的AI语音产品。

成本控制和效率提升都能做到,那台词翻译的“信达雅”,AI是否能够像人一样专业?邢瑞琪告诉记者,这就是垂类大模型相较通用大模型的“专业”所在了。以垂类大模型为基底,通过在平台翻译的专有数据沉淀反哺模型优化,让翻译更有“人味”。

垂类大模型,解决的不是最大公约数用户的痛点,而是垂类场景下的技术诀窍问题。

“有人味说人话”的数字人

你有因为AI客服的“听不懂话”而深感无语的经历吗?

趣丸科技的数字人产品

晚间新闻上的新闻播报员、办公大厅里的数字员工、直播间里的带货主播,随着AI的不断发展,数字人以“无孔不入”的姿态“入侵”了我们的日常生活。数字人赛道卷出天际,但人机感与“一眼假”的问题一直横亘在数字人领域。

趣丸科技的“10秒生成高自然度数字人”,在国内电商平台的市场占有率做到了头部。据透露,目前,趣丸科技在直播零售板块的服务客户累计商品交易总额已突破10亿元。除直播电商外,在政府部门的服务数字人领域也有应用。“上个月我们就和广州市工信局推出了省内工信领域首个政策服务数字人‘穗小信’。”刘静雯说。

AI数字人(受访者供图)

她表示,“像个真人”和“听得懂话”,是衡量一个数字人做得好的基本标准。在真实世界中,人与人的沟通表达不局限于语言文字、语气等方面,还包括肢体动作、面部肌肉的复杂活动。“因此,一个好的数字人,动作和表情会很丰富。不仅要做到唇形同步,面部的其他肌肉、上半身,甚至手部也要实现更像人的协同运动。甚至人物有动作的时候,头发丝也会跟着律动”。

声音的高拟人化和高情感也是消除AI人机感的重要一环。相较于走“播音腔”的学习路线,趣丸科技与香港中文大学(深圳)联合研发的MaskGCT大模型可以做到高度还原人类发声的个性化音色、语调、风格与情感。“我们真人说话是不会像朗诵新华字典一样的,多少都有些发音的区别。想让一个模型说话有人味,我们坚持这样的技术路线才是可行的。很难、但是要做。”邢瑞琪进一步补充道,目前,团队正在努力解决如何保留人的特性发音声带结构或者一些地道口音的非人机味发音。

“我们的数字人性价比高,这个很重要。”刘静雯笑道,依托于趣丸科技的自研大模型技术,目前已经把数字人的成本从过去的万元级、几十万元级降低到了百元的级别。

其次是数字人的实时交互。据刘静雯介绍,让数字人能够理解并且回答用户提出的需求和问题,既涉及交互技术,还有专业知识的储备。不过,她也直言,目前让数字人能够理解和实时处理人类的复杂需求还有一定的局限,尤其在医疗等专业领域,需要学习大量的专业知识和落地实践,才有可能被规模化应用。

当被问到数字人和AI的不断发展,是否会加剧一些岗位的消失时,邢瑞琪和刘静雯都毫不犹豫地给出了回复:不会。“AI+人的服务,是AI落地的基本原则。”在邢瑞琪看来,从蒸汽时代到电气时代,再到如今,大家都在提及工人下岗问题。但事实是技术的成熟带来的是更多专业的技术岗位。“AI是在赋予岗位,而不是剥夺,只是岗位的价值在优化而已”。

趣丸智能

数字化留存的人文与艺术

不论是AI语音、AI音乐,或是数字人,趣丸科技的自研人工智能大模型都是围绕人的元素开展。如果说数字人是形象、趣丸千音是声音,那么代表AI音乐的天谱乐就是创意。

2025广州国际体育嘉年华主题曲(受访者供图)

作为全球首个多模态音乐生成大模型,天谱乐AI能够实现文本生曲、音频生曲,还首创了图片生曲和视频生曲功能,生成的歌曲自带人声唱词,效果达到专业发行水准。据刘静雯透露,今年天谱乐将深度参与十五运会,将AI生成的旋律与羊城元素结合,打造兼具科技感与文化底蕴的视听盛宴,助力“赛事流量”转化为“文旅留量”。

以数字化形式,天谱乐将琵琶、古典竖琴等传统乐器声音进行数字化保留,并能够还原濒危音乐遗产。“AI不会杀死艺术,而是会拓宽艺术的表现手法,催生出新的审美力量。”刘静雯表示。

“AI+艺术”融合过程中,如何保留人文价值?邢瑞琪则提到了一个观点:AI技术或者模型在某种程度上帮助人类实现永生。“今天我们看到很多歌唱家、配音演员随着年龄增长、声带受损等疾病以及种种原因,不再能歌唱或‘营业’。我们能够利用AI将艺术与人文中优质且特别的东西以数字化形式保留,并应用在未来的影视或音乐场景中”。

随着大模型的进步,它能够理解图像和视频的多模态,并将其和文本一并转化为声音。那么视障人士就能通过声音,实时了解周围正在发生的事情。你正在看到什么?你的身边有谁在?现在天气如何?

趣丸科技周边产品

邢瑞琪向记者描绘了一个看得见的大模型的未来。

记者手记

全新人工智能已不远

过去在采访数字化相关企业过程中,我看到了很多传统企业拥抱数字化与数智化,积极寻求转型的故事,但这次的企业略有不同,这是一家天然就以人工智能与数字化技术研发为起点的互联网科技企业。这样的企业是怎么讲数字化的?带着问题完成采访后,我有了很多新的收获,一个全新的人工智能的未来,或许已经不远了,它能为我们弥补许多的遗憾。

人工智能请回答:

DeepSeek如何看待趣丸科技?

作为国家高新技术企业,趣丸科技依托生成式AI、数字人、多模态音乐生成等核心技术,构建了全栈式AI交互技术生态,展现出显著的创新能力和产业影响力。

技术研发方面,趣丸科技自主研发的全球首个多模态音乐生成大模型“天谱乐”能在1-2分钟内生成出版级歌曲,极大降低了音乐创作门槛。数字人技术通过高精度3D形变算法和华为云昇腾算力支持,实现分钟级生成高自然度数字人,面部相似度超过90%,口型匹配率超过95%,成本降至百元级,广泛应用于电商、政务、文旅等领域。

此外,公司重视人才培养,研发人员占比超过62%,产学研合作加速技术转化,形成人才与技术双驱动的创新生态。总体而言,趣丸科技以技术深耕与场景渗透,成为数智化转型的标杆企业。

总策划:任天阳

总统筹:林海利

总执行:孙璇

策划执行:吴江

统筹执行:孙晶 刘佳宁

文|记者 杭莹

图|记者 董鹏程

编辑:丁玲