• 微信

聚焦大模型应用落地,对话探索者勾勒赋能蓝图及AI翻译实例

时间:2025-04-29 22:01作者:admin分类:大千世界浏览:100评论:0

开栏语

大模型正加快从技术竞逐的“实验室”迈向产业落地的“深水区”。在这股浪潮里,一些先行者凭借敏锐洞察力与破局勇气,率先探寻技术与场景的融合边界。他们是打破算力束缚的开源先锋。他们是深耕垂直领域的场景拓荒者。他们是构建生态协同的产业布道者。

我们聚焦大模型应用落地的“最后一公里”。我们与探索者对话,这些探索者以技术为矛、以场景为盾。我们试图勾勒出一幅大模型赋能千行百业的“清明上河图”。我们要为行业提供可复用的方法论。我们还要为中国AI产业的全球化突围注入信心与动能。

(策划:郭荣村、李少婷)

义乌小商品城外贸出海之风盛行。有不懂英语的店员。他们对着海外直播平台热情阐述。大模型帮他们把订单全部揽下。这都归功于AI翻译。

在大模型重塑各行各业的浪潮里 传统翻译已演变成融合语言理解 知识处理 文化适配的综合性智能服务体系 也就是说 翻译不再是被动接受技术赋能的领域 而是主动引领大模型产业变革的前沿试验场

但热潮的另一面 是智能语言服务行业悄然的变革 机器翻译数量增多 人类译员工作未减少 然而单价却下降了 订单量增长和盈利能力滞涨形成悖论 在这场人机博弈里 终极胜负手或许藏在未被算法吞噬的认知褶皱与知识基因之间

近日《每日经济新闻》记者进行专访。专访对象是国家专精特新“小巨人”企业传神语联网网络科技股份有限公司创始人何恩培。该公司简称传神语联。

当前 大模型竞争进入第三年 有新玩家突出重围 座次发生变化 何恩培觉得 此时谈定局太早 大模型远未成熟 当前类似1920年电气时代 基础技术已诞生 五花八门的应用未被发掘

在他看来 智能语言服务行业正从“单纯的语言转换”迈向“知识理解与应用” 在此趋势下 传神语联选择“后撤一步” 提供服务于行业的底层技术和工具 在面向应用提供服务时 他们意识到 “大数据”并不适用 质量比数量更重要

人机博弈:订单贬值,发力底层

技术发展脚步愈发快。各行各业面临的拷问越发相似。即人工智能是否会取代我们。

在这场关乎生存的讨论里智能语言服务行业是最早被卷入的领域之一早在大模型热潮来临前机器翻译就在持续进化逐渐侵占人工翻译的生存空间

这种焦虑对客户预期造成冲击。客户会想,如果机器翻译能达到“基本能看懂”的程度,那为何还要支付高额的翻译费用呢?

生成式AI席卷而来,人工翻译会成为最先被取代的职业吗?

何恩培坚信语言不只是沟通工具,还是人类思考的“操作系统”,是复杂且动态的体系,机器需借助自然语言理解世界。他笃信翻译可能是人类与机器博弈里最后消亡的行业。

但在这场人类与机器的“博弈”里,智能语言服务行业展现出一个值得探究的信号。订单增长幅度明显高于收入增长。何恩培给出这样一组数据。2024年,传神语联的智能语言服务收入增长了10%。然而订单量增长了30%。

从表面来看,这是个乐观信号。订单量增长表明市场需求依旧旺盛。然而订单的碎片化趋势正在重塑行业。过去一个翻译订单或许价值很高。如今订单金额却越来越小。原因是客户自己能“看懂”了。

机器翻译的广泛应用让语言不再构成阻碍。提供智能语言服务不再是“自始至终”的工作。而是变成了“修正与优化”的服务。客户需求更为精确。与此同时。客户对人工翻译的付费意愿降低。既然机器准确率能达95%。为何还要收取高额费用?

然而何恩培觉得 知识型产品有个明显特点 就算机器翻译准确率达95% 但只要还得人工从头到尾审查 去识别那5%的误差 处理速度就会降到人工水准

人与机器的博弈致使企业间产生了博弈。客户普遍觉得,机器初步翻译后稍作修改就行,所以付费意愿降低。为获取客户,智能语言服务企业选择压低价格。成本端唯一的对冲办法,是在部分场景中使用机器翻译。机器不可避免地抢占了一部分市场。人类译员的工作量减少,单价也随之降低。

在博弈里,传神语联选择采取“后撤一步”的做法。何恩培作出解释,以往,智能语言服务公司是直接为终端客户提供服务的。然而未来,传神要做的是进行“赋能”。要让合作伙伴,像翻译公司、中介机构等,去满足直接的语言需求。而传神则为这些合作伙伴提供底层技术以及工具。

这一策略背后的核心逻辑是,智能语言服务行业正发生转变。它正从“单纯的语言转换”转向“知识理解与应用”。何恩培表示,“传统翻译的总量并未减少,只是产品形态有了变化”。他还说,“客户所需的,不再是简单的文本转换,而是一整套基于大模型的知识处理能力”

数据不是越多越好:质量决定价值

专访传神语联创始人何恩培:翻译不死,但必须借助大模型重构丨AI先行者档案_专访传神语联创始人何恩培:翻译不死,但必须借助大模型重构丨AI先行者档案_

出海,已然成了各家科技企业无法回避的话题。何恩培觉得,对中国企业来讲,AI出海的真正挑战并非语言问题。而是要助力企业在新的市场环境里达成知识迁移。还要实现业务落地。

何恩培觉得理想的情形是大模型成为知识转换与传递的工具。然而现实比理想复杂。现今大模型在语言覆盖方面存在很大局限。特别是针对非英语市场。数据的训练深度和准确性不足以支撑高质量业务应用。他还表示每家企业的现有数据都很重要。原因是企业依据自身特色出海。他们关心的是能否听“懂”

企业高质量数据稀缺。这使得大模型在解决客户深度问题上未展现出绝对优势。何恩培表示,他认为当下距离大模型真正解决客户问题还有一段路要走

他指出 过去企业将记录与数据混为一谈 他们觉得工单 硬盘上的内容也是数据 但这只能称作记录和资料 数据的价值不在于存量 而在于其系统化程度 以及可被机器学习和推理的程度

在人工智能发展的起始阶段,行业普遍追求“大数据”。也就是投入数量巨大的数据来进行训练,以此换取更强大的模型能力。然而,当大模型渐渐成为基础设施时,数据的“质量”会比“数量”更为重要。

在何恩培看来 数据 参数 算法不是孤立存在的 而是有着动态平衡关系 数据和参数规模在一定范围内能促使性能增长 但算法创新才是突破“天花板”的关键

早期开发翻译软件时 何恩培体会到了数据和规则规模的边际效应 设定1.5万条翻译规则时 效果很好 但规则规模扩展到2万条时 效果变差了原因很简单。数据之间存在冲突。规则之间存在冲突。统计概率的关系也可能产生矛盾。换句话说。数据或参数在某个阶段增加能带来提升。但增长到一定程度后。如果算法不突破。模型的质量反而会下降。

数据问题是传神语联提出“数推分离”架构的核心缘由。何恩培回忆,早在2021年,传神语联为法律行业开发了一套AI系统。该系统能学习过去十年的法律案例。但客户很快提出一个关键问题,即新产生的数据如何处理,是否还要重新训练一次。

这使得他们开始思索:要是数据与推理能够分开,那么AI系统便能在不依靠大规模训练的状况下,达成自我学习与进化。何恩培阐释说:“我们无需将所有数据压缩进神经网络,而是要让推理大脑保持轻巧,同时支持实时学习。”这种架构不但降低了模型的计算成本,还提升了适应性,让它能够在动态环境里持续优化自身

DeepSeek热潮过后 知名投资人朱啸虎曾表示 以后给数据打标签这项工作得由博士生来做 何恩培认可此观点 称现在处理数据时 很多情况已是博士生在负责 在当下人工智能热潮里 数据价值并非取决于数量 而是取决于质量 以及其中蕴含的知识密度

他举例 若一名律师过去十年处理过500个案件 那他大脑就沉淀了丰富专业经验 当有人请教相关问题 他不用拿出所有案卷逐条翻阅 而是能直接给出综合判断和方法论 这位律师的大脑就是个“行业大模型” 其价值在于知识提炼 而非原始数据堆积

何恩培觉得,AI的未来会朝着这样的方向发展。企业通常不愿分享自身高价值数据,原因是数据常涉及核心业务与商业秘密。然而这并不表明数据不能转化为价值。他表示:“数据可不外流,但由数据训练出的智能能够共享。”

谈定局为时尚早:大模型还远未成熟

何恩培称回看成长路径,从最初的2.1B模型到如今的9B,公司在参数规模上未曾盲目堆砌,在算力投入上也没有无限制进行。这并非因资源短缺,而是公司一直觉得这是更有效的技术路线

在他看来 衡量大模型价值的核心指标 不是参数规模 而是能否切实解决客户问题 这种思路 在行业内引发了一定认知挑战 销售和前端团队 有时会碰到客户的质疑 模型参数不到100亿 能算大模型吗 但客户真正使用后 就会明白 关键不在参数 在效果

在当前科技环境里,“国产”“根技术”“0到1”已成为热门词汇。然而在何恩培看来,这些概念的边界比市场讨论的更为复杂。

何恩培觉得,根技术是产品及应用最为基础的底层能力。它能够是自行研发的。也能够是基于开源而来的。甚至能够是经授权获取的。但不管怎样,“我们掌握了这项技术,这项技术便属于根技术,掌握了根技术,起码意味着我们自身有了一定的主动性”。而“从0到1的技术”等同于某项应用发明。它既能够在应用层。也能够在根层。

在他眼中,AI未来的竞争,不只是参数规模的比拼。更是底层技术框架的较量。未来人工智能会衍生出无数行业专用模型。这些模型的底层架构将决定其智能边界。

“根原创”是何恩培所提出的概念。他觉得这是根技术里最具生命力的部分。何恩培强调,只有在“根”上创新,才能真正拥有自身的技术思想。他还指出,技术体系具有思想性。若所有技术来源都依赖外部开源框架,便很难摆脱既有框架的思想束缚当企业在根技术层面有自主权时。它能摆脱对外部技术的依赖。它还能决定自身技术演进的方向。这是最有创新价值的部分。

在商业领域,大模型竞赛进入第三年。大模型的商业模式以及技术最终是否应免费,在行业内愈发受到关注。以往,众多科技公司的商业模式是先“烧钱搞免费”,而后通过其他途径盈利。比如,搜索引擎免费,却靠广告获利;手游免费,靠道具收费。

然而,大模型的情形好像更为繁杂。何恩培的关键看法是,To B(企业级)市场的AI服务不会免费。企业运用AI的核心目标是解决业务问题,解决问题必然会产生成本。他表示,只是在竞争中将成本降至最低,肯定不会免费。一旦免费,它便缺少了这项技术持续运转的能力。这是由技术的稀缺性决定的。这也是由商业模式决定的。

何恩培觉得,当下的大模型远未成熟。市场格局尚未确定。此刻探讨最终格局太早了。

当下类似1920年的电气时代,电力技术已然成熟,然而没人能料到后续会有诸多家电、设备被发明出来。一方面,如今大模型存在诸多未解决的问题,无法像成熟产品那样占据所有领域。另一方面,当前市场竞争仍聚焦于通用大模型,垂直场景中的模型尚未兴起。何恩培表示 也许未来 会有一万个AlphaFold出现在不同行业 如此 才能形成大模型的完整生态

每日经济新闻

文章评论