只接受发布货源信息,不可发布违法信息,一旦发现永久封号,欢迎向我们举报!
免费发布信息
货源通网 > 餐饮行业新闻资讯 > 疫情防控资讯 >  第四范式大模型产品完成两个月内的第三次迭代:以生成式AI重构企业软件 “看得到的解说”上线 咪咕视频智能字幕带来暖心陪伴


第四范式大模型产品完成两个月内的第三次迭代:以生成式AI重构企业软件 “看得到的解说”上线 咪咕视频智能字幕带来暖心陪伴

发布时间:2024-09-18 16:47:28  来源:网友自行发布(如侵权请联系本站立刻删除)  浏览:   【】【】【

第四范式大模型产品完成两个月内的第三次迭代:以生成式AI重构企业软件 “看得到的解说”上线 咪咕视频智能字幕带来暖心陪伴 

第四范式大模型产品完成两个月内的第三次迭代:以生成式AI重构企业软件

第四范式首次提出AIGS战略(AI-Generated Software)。

据IPO早知道消息,第四范式于4月26日首次向公众展示其大模型产品「式说3.0」,并首次提出AIGS战略(AI-Generated Software):以生成式AI重构企业软件。

换言之,式说将定位为基于多模态大模型的新型开发平台,提升企业软件的体验和开发效率,实现AIGS。

值得注意的是,本次发布的「式说3.0」是第四范式在短短两个月之内发布的第三个版本:

1.0:在ChatGPT火了之后,第四范式在2月推出了第一代的产品——式说1.0有生成语言的能力,并且解决GPT技术应用时内容可信、数据安全和成本的三大问题。当时主要的场景就是文库问答,相当于让GPT学习的企业知识后,可以解答专业问题,并且可溯源。

2.0:在式说语言能力基础上,加入了文本、语音、图像、表格、视频等多模态输入及输出能力,并增加了企业级Copilot能力。以与企业内部应用库、企业私有数据等进行联网,对信息和数据进行分析,回答员工的问询或执行相关任务,从知识助手成为业务助手。

3.0:在生成式和语言能力的基础之上,3.0发力Copilot和思维链COT(多步推理、复杂任务拆分、形成数据飞轮),改造传统B端企业软件的体验与开发效率。

B端企业级软件的复杂性

为AIGC留下了足够大的重构和改造空间

第四范式创始人兼CEO戴文渊表示:“C端产品已经逼近用户体验的上限,而B端的企业级软件往往是个十分复杂的执行系统,堆砌十几层菜单和成千上万功能也不算多。”

在戴文渊看来,目前这些B端软件极为复杂的交互体验,以及复杂性带来的极低开发效率,恰恰为生成式AI留下足够大的重构和改造空间。

不可否认的是,C端的软件体验在过去的十几年已经被打磨到了比较高的水准,用对话未必就一定更好用,而在企业报销系统、HR系统、OA系统等B端软件这一侧,体验并没有很好地完成优化。

“过去很难通过人类语言(自然语言)的方式去调用企业软件的功能,现在当我们有更强的语义理解和生成能力,再加上GPT任务翻译、任务分发和推理的能力,就可以通过更好的「对话框式」交互方式实现功能的调用,不再需要找到某个位于十几级的菜单目录之下的功能。”戴文渊说道。

另一方面,由于原先B端企业软件都是高度定制化的,基于菜单式的开发,基本每次一个功能升级,又要产品经理画界面,设计、开发等,至少是月级别的开发时间。而由于新的交互形式的出现,以前是功能和执行逻辑被编排在软件界面,现在功能和逻辑被改写在数据、API和内容层面,变成了天级别的开发效率。

“以前软件是在界面层面的升级,未来是在数据层面的升级。”戴文渊指出,“我们看到大模型能够带来用户体验的提升,开发效率的提升,所以一定会形成软件行业的飞跃,就是谁率先能做出来的问题。这是一个巨大的市场。大模型是新的生产力,以大模型基础设施为先导项目,改造整个软件产业,整个行业的业务价值、商业模式都会得到飞跃。”

大模型更重要的在于

模型具备Copilot和思维链CoT的能力

具体到产品层面,戴文渊认为,要做到AIGS,大模型未必需要是知识广博、十项全能冠军的通才,更重要的在于模型具备Copilot(副驾舱),和思维链CoT(chain of thoughts,多步推理)的能力。

为此,第四范式将AIGS的路径总结为三个阶段:

第一阶段,Copilot调动不同的信息、数据、应用,作为助手完成用户的指令。相当于在所有企业级软件系统里,配备一个指挥官。指挥官听用户的指挥,比如“把照片亮度调亮20%”。

第二阶段,Copilot+基于企业规则的“知识库”,AI能够参照规则做复杂工作,进一步丰富了「对话框」的能力。比如AI查询了“人像美化”知识库后,能执行把照片修好看的步骤。

第三阶段,Copilot+CoT(思维链)。软件系统的使用行为最终会被大模型学会,形成AI针对这个领域的思维链,意味着“把照片处理得更好看”这种复杂指令,AI能自动地按照步骤完成。

第四范式的AIGS战略,就是指基于式说大模型背后的Copilot+COT能力,把企业软件改造成新型的交互范式,并在新型交互上不断地学习软件的使用过程,形成领域软件的“思维链”。

这意味着,对于企业软件合作伙伴来说,可以基于范式的大模型能力,在一个个领域里面钻的足够深,学习到足够多的数据,最终所形成领域的思维链,发展成“领域”大模型。当思维链复杂度到一定程度以后,它的软件就能够自动执行越来越复杂的功能。

对AI产业化的深层次理解

使得自己更清楚如何落地才能产生最大价值

事实上,之所以第四范式在短短几个月的时间内就可以推出自己的大模型产品并完成持续迭代,还是基于其过去数年的技术积累。

据「IPO早知道」了解,在BERT出来的时候,范式研究院就开始关注并投入在这个技术领域,GPT3出来以后更加明确了要朝这个方向。

首先,范式拥有做大模型的技术能力。虽然先知不是做通用模型的定位,当时定位是做专用模型,但先知一直强调模型是要高维的,所谓的高维其实就是参数,要把模型做大,就像GPT3.5是1700多亿的参数,这是从技术上来说能平移过去的地方。此外范式拥有国内领先的研究院、工程化、产品力的全栈技术能力。

其次,范式原有市场和新市场所面对的产业链正好是上下游。以前AI更像是一种重要零件或者元器件,这些以外的其他地方不是AI覆盖,是企业软件覆盖。企业软件经过了这么多年发展,基本上能把所有的事都覆盖了。范式和软件公司一直互为生态,范式做的是软件里面的AI决策,软件公司做功能和流程的实现。

当然,戴文渊坦言,相比今年的投入,过去几年肯定还是有差距的。

“ChatGPT对我们最大的帮助,就是整个市场的信心一下从0调满了,确定性的投入更大了,再往后就是变成产品、变成商业化的路线往市场去推。”戴文渊表示,“我们互相共生也很了解,看到GPT3时已经知道了,是可以帮助到企业软件市场的。做这个事情还是需要非常强的一个行业积累,第四范式过去几年在行业里面扎得还是比较深的,我们对AI产业化的深层次理解,更清楚明白大模型作为新生的生产力工具,如何落地才能产生最大的价值。”

发布于:上海


“看得到的解说”上线 咪咕视频智能字幕带来暖心陪伴

大到比赛训练,小到衣食住行,北京冬奥会处处体现着科技魅力。云上冬奥、最快的冰、“零重力”智能床等等,打造着冬奥的“科技感、未来感”。而在智慧观赛方面,除了8K 、XR、子弹时间等黑科技外,智能字幕、智能语音服务、手语播报数字人等“有温度”的技术,更是让“同一个世界”见证了“同一个梦想”的绽放。

在这场筹备已久的全民冰雪盛会中,暖心科技从未缺席。据了解,全球有超4亿人听力受损,被“听不清、听不真”所困扰。如何打破“无声的世界”,让体育的激情传递给更多的人?如今,科技打开了一扇同频共振的窗。

近日,一封特别的感谢信出现在众人眼前。中国聋协在社交平台上表示,“我们非常感谢咪咕视频首次在冬奥会直播中创新加入智能字幕功能,让听力有障碍的朋友们也可以无障碍观看冬奥体育赛事直播,通过实时字幕‘聆听’精彩解说,沉浸投入到冰雪赛场的每一个动人心魄的瞬间。”

“这是看冬奥比赛最暖心的功能之一”。在一个无障碍小组交流群中,群友们也纷纷为智能字幕这一暖心科技点赞,表示“我们可以去看王濛的解说了!”

感谢与感动,正是来自于咪咕视频在冬奥会直播中上线的智能字幕功能,这个功能还有个暖心名字——“为了听不到的你”。集语音识别、智能翻译、字幕生成等功能于一身的咪咕智能字幕,在赛事直播过程即可同步呈现字幕,让解说“听得见”更“看得清”。

智能字幕不仅为听障人士打造了“信息无障碍”的桥梁,对于听力正常人士同样适用。观众常常因各种原因,将比赛直播调至“静音”状态,或在嘈杂的环境中因听不清而错过了比赛的精彩时刻,亦或是因不够了解赛事专业术语而显得“一头雾水”。

如今,智能字幕将改变这一现状。依托语音识别技术,结合神经网络算法,应用体育垂直场景的实时纠错自然语义能力,智能字幕可达到98%的准确率,让不同人群在任何环境中都可以畅享实时专业解说,不错过任何精彩时刻。

此次的冬奥征程,智能字幕不仅提供中、英双语字幕的呈现,还覆盖了花样滑冰、短道速滑、单板滑雪、自由式滑雪等数百个比赛场次,为世界各地的云上观众提供全程暖心陪伴。此前,智能字幕很少出现在大型国际赛事的超高清直播中。由于错别字和延迟等原因,直播字幕历来都是难点,体育赛事直播字幕更是难上加难。本届冬奥会的智能字幕技术,填补了这一空白,在打破语言沟通壁垒的同时,做到真正的“科技不让每一个人掉队”。

赛场上冰雪健儿们挥洒热情,赛场外的云上观众与之同频共振,赛场内外书写了一个个又燃又暖心的冬奥故事。当“科技冬奥”打破语言和国界的壁垒,带领大家追逐热爱,拥有更多幸福感,这场冰雪盛会注定令人难忘。

发布于:湖南

责任编辑:
热门阅读排行
© 货源通网 免费发布信息