-
百度版ChatGPT“文心一言”亮相,李彦宏:发展远未完善、进步空间很大
最后更新: 2023-03-16 18:36:53(文/吕栋 贺喜格)
在OpenAI推出大模型GPT-4一天后,百度官宣已久的类ChatGPT产品“文心一言”也终于公开露面,并且和GPT-4一样是多模态。
北京时间3月16日下午,百度召开发布会,主题围绕新一代大语言模型、生成式AI产品“文心一言”。
观察者网在现场看到,百度首席执行官李彦宏和百度首席技术官王海峰均出席了发布会,并在现场展示了“文心一言”在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
在现场,李彦宏用录好的视频进行了演示。
从展示案例来看,“文心一言”某种程度上具有了对人类意图的理解能力。但李彦宏也多次提及,这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展。
观察者网从现场了解到,此次“文心一言”公开亮相后,并不会直接面向公众推出,而是先采用邀请测试方案。从3月16日起,首批用户可通过邀请测试码,在官网体验产品,后续才会陆续开放给更多用户。
那么,百度为何甘冒风险,略显仓促地推出“文心一言”呢?这一方面可能是为了抢得对标ChatGPT的头筹,获得更多用户以训练大语言模型,另一方面则可能考虑到内外部的需求。
李彦宏在现场表示:“在全球的大厂中,百度是第一个做出对标ChatGPT的产品的企业。虽然‘文心一言’的内测体验不能称作完美,但为什么现在发布呢?是因为百度的各个产品现都在等着这样的产品,我们的客户和合作伙伴也在等着这样的技术。”
在此次发布会之前,有外媒援引知情人士称,为了开发“文心一言”,数百名百度员工一直在夜以继日地工作。甚至在正式发布前夕,“文心一言”基于的AI模型仍在接受数据训练。一些员工坦言,他们没有足够的时间来打造一款功能完善的产品。
根据百度方面的披露,“文心一言”大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。
那这次通过视频亮相的“文心一言”表现如何呢?在现场,李彦宏展示了“文心一言”在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。
以文学创作场景为例,“文心一言”根据对话问题将《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。商业文案创作场景中,文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。
在数理推算场景中,“文心一言”能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。
作为扎根于中国市场的大语言模型,文心一言在中文语言和中国文化上,相比国外的大模型产品无疑会有更好的表现。在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。
昨日(3月15日),OpenAI发布多模态模型GPT-4,可接收图像和文本输入来输出文本内容,受到外界关注,而文心一言本次发布的版本同样具备多模态功能,支持文本、图片、音频、视频生成。
在更体现技术能力的多模态生成方面,李彦宏现场展示了“文心一言”生成文本、图片、音频和视频的能力。有趣的是,“文心一言”甚至能够生成四川话等方言语音;“文心一言”的视频生成能力则因成本较高,现阶段还未对所有用户开放,未来会逐步接入。
从“文心一言”的表现看,某种程度上它具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但整体而言,这类大语言模型还远未到发展完善的阶段,有赖于通过真实的用户反馈而逐步迭代。
王海峰表示,文心一言,是新一代知识增强大语言模型,是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。
前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中也已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新。
多年来,百度大语言模型上投入积极,有市场数据显示,百度研发的50%-60%的投入都给到了Ernie。
近日有外媒援引知情人士称,随着ChatGPT热度上升,今年1月初,百度高管让其自然语言处理团队开始用文心大模型整合出一款对标ChatGPT的产品。但前述知情人士表示,与其他从事类ChatGPT技术的AI开发者所遇到的情况一样,这一项目面临一些挑战。
其中一个挑战是,需要训练该模型对有多种释义的短语或可指代多人的名字进行辨别,从而能对用户的要求做出更精确的反应。另一个挑战是使该聊天机器人生成的语言看起来更像人类说的话。第三个挑战是提高事实准确性,这是大语言模型的一个技术限制;大语言模型会根据不同词语可能出现在一起的概率将句子串起来,而不是根据信息片段。这种限制也使得这种模型难以控制以避免敏感话题。
“文心一言”的真实水平如何,还有待观察百度后续推出的公测版本。据百度披露,自2月份该公司官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。
有市场观点指出,百度之所以没有迅速开放公测,一方面是因为产品尚未成熟,另一方面可能也是出于成本和收入考虑。之前有估算称,ChatGPT每天成本消耗有超过10万美元。来自摩根士丹利的分析师估计,ChatGPT每次查询的成本大约是谷歌传统搜索查询成本的七倍。
在本次发布会上,李彦宏表示:“无论哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年坚持和积累,没法速成。”他同时提到,如果建立起真实用户反馈、开发者调用和模型迭代之间的飞轮,“文心一言”效果会迅速提升。
本文系观察者网独家稿件,未经授权,不得转载。
- 责任编辑: 贺喜格 
-
华之杰转战主板IPO,科创属性曾被质疑
2023-03-16 17:21 观网财经-金融 -
每16个中国人中就有1位残障人士,街道上为何很少看到他们?
2023-03-16 16:51 观网财经-科创 -
外交部:美方迄今未能证明TikTok威胁其国家安全
2023-03-16 16:20 观网财经-海外 -
日本2月贸易逆差8977亿日元,连续19个月逆差
2023-03-16 14:55 日本 -
威尔仕健身就“转卡理财”致歉:下月起会籍年限不得超过15年
2023-03-16 12:07 315维权 -
车市价格战愈演愈烈,吉利、北汽“参战”
2023-03-16 10:53 -
被曝后厨乱象,网红西餐厅蓝蛙致歉
2023-03-16 10:52 315维权 -
2月70城房价:商品住宅售价环比总体上涨
2023-03-16 10:02 观网财经-房产 -
欧美银行股遭巨量抛售,新的“雷曼时刻”要来了?
2023-03-16 09:48 观网财经-金融 -
六连降!中国对美国债持仓规模连续10月低于1万亿美元
2023-03-16 09:29 美国经济 -
全国12315平台上线以来,为消费者挽回经济损失144.72亿
2023-03-16 08:36 -
我担心发展中国家会出现类似1998年亚洲金融危机
2023-03-16 07:53 -
美国财政部公布1月国际资本流动报告
2023-03-16 07:35 -
用比特币还债被判无效,法院:不具有法偿性
2023-03-16 07:35 疯狂比特币 -
关于2022年国民经济和社会发展计划执行情况与2023年草案的报告
2023-03-16 07:21 2023两会 -
中沙首笔人民币贷款合作,会影响什么?
2023-03-16 07:11 观网财经-海外 -
关于2022年中央和地方预算执行情况与2023年草案的报告
2023-03-16 07:11 2023两会 -
315晚会第一枪:这些“泰国香米”竟是香精勾兑而来
2023-03-15 20:18 食品安全 -
我国成功发射试验十九号卫星
2023-03-15 20:16 航空航天 -
杨紫琼奥斯卡“封后”马来西亚放假一天?梦一场
2023-03-15 15:29
相关推荐 -
没有中国制造的家可能吗?美媒画了张图… 评论 7对话孙俪:诠释不完美中年人,生活不给你矫情的时间 评论 36德防长劝乌克兰:别听特朗普的,这是投降 评论 196超越DeepSeek,中国开源“集团军”重塑全球AI生态 评论 130伊朗港口大爆炸已致28死,与导弹燃料有关? 评论 76最新闻 Hot
-
没有中国制造的家可能吗?美媒画了张图…
-
美部长丢包案告破:被人用脚勾走的…
-
特朗普前首席经济顾问:我们最离不开的正是中国的产品
-
对话孙俪:诠释不完美中年人,生活不给你矫情的时间
-
“没有中国烟花,美国明年怎么庆祝建国250周年”
-
特朗普:泽连斯基准备好了“割地”
-
美海军提议:日本可协助美军建造军民两用船
-
江西省国资委原副主任李键再次被查,曾因多次给苏荣送钱被通报
-
幸福航空突然停飞“五一”前全部航班,财务人员透露“没钱飞了”
-
“订单量暴跌,美国进口商巴望着和中国达成协议”
-
德防长劝乌克兰:别听特朗普的,这是投降
-
驱逐4岁患癌儿童,“边境沙皇”辩护:没啊,只是驱逐了他们妈妈
-
1.9万元港币现金遭调包,海南酒店方致歉
-
“就算美国从第三国进口,兜兜转转,绕不开中国”
-
申强履新靖江市委书记,前两任均落马
-
特朗普:泽连斯基现在更加冷静,更想达成协议
-