对于大部分创业者和企业来说,新的机会在于基于新的技术平台开发新应用服务。就像移动互联网时代,最成功的商业产品不见得是安卓和iOS,而是基于安卓和iOS开发的微信、淘宝、抖音等各种超级应用
图/视觉中国
文|《财经》记者 刘以秦 顾翎羽 编辑|谢丽容2023年3月16日,百度启动生成式对话产品“文心一言”邀请测试。这是国内第一款对标ChatGPT的生成式对话产品。当天,百度创始人李彦宏说,大家对它的期望值是对标ChatGPT,甚至要对标GPT-4,这个门槛还是很高的。3月16日,百度新闻发布会后,百度港股股价单日跌幅6.4%。3月17日,股价回弹,单日上涨13%。
有差距也有亮点
新闻发布会现场,李彦宏展示了文心一言的5个场景,分别是:文学创作、商业文案创作、数理推算、中文理解、多模态生成。《财经》记者对比文心一言和GPT-4针对同一问题的回答,发现文心一言对于中文的理解,在某些时候是优于GPT-4的,例如当问题是病句或容易造成歧义的表述时,文心一言能够理解提问者的意思,GPT-4的回答会有所偏离。同时,它们都存在“胡说八道”的情况,不过,新版Bing中的GPT-4会附上内容来源链接,便于用户二次确认。文心大模型训练使用的数据以中文为主,因此文心一言能够更好理解中文,甚至能生成不同方言的音频。文心一言也支持英文互动,但效果相对较差,其他语种目前还不支持。此外,文心一言会选择性回答问题,若问题中涉及敏感词,它会说“我无法回答这个问题”。李彦宏提到,整体而言,这类大语言模型还远未到发展完善的阶段,它们有时候会有很惊艳的表现,但不少场景下,细究起来还有明显的问题,进步空间很大。大模型训练成本高昂,需要有大算力、大数据和大模型,每一次训练任务都耗资巨大。百度拥有全栈式AI能力,从芯片(昆仑芯),到深度学习框架(飞桨),再到预训练大模型(文心),到搜索、智能云、自动驾驶、小度等应用,各个层面都有自研技术。李彦宏表示,全栈式布局可以大幅提升效率,显著降低成本。另外,芯片、框架、大模型、和终端应用场景,可以形成一个高效的反馈闭环,帮助大模型不断优化迭代。新商业机会
马斯克是OpenAI最早的创始人之一,后期退出。今年2月,他在社交平台上公开批评OpenAI“最初是作为一家开源的非营利性公司而创建的,这也是为什么我把它命名为OpenAI,旨在抗衡谷歌,但现在它已经成一家闭源的营利性公司,并由微软控制……这完全不是我的本意”。
中国AI大模型进展
基于大模型的生成式AI已经成为新一轮市场热点。数据服务商Dealroom报告显示,全球生成式AI企业估值已达480亿美元,在过去2年里翻了6倍。中国投资人和创业者们也已经入局。前美团联合创始人王慧文成立AI公司“光年之外”,多家知名投资机构立即跟进,天使轮估值已经达到2亿美元。一家在几年前就开始做大模型的AI创业公司,一度无人问津,近期该公司创始人告诉《财经》记者,几乎每天都有不少投资机构来询问是否接受融资。目前,中国初创公司中,能够做出真正有影响力产品的还很少。多位投资人表示,短期内能够看到实际应用效果的,可能是抖音、快手这类视频平台。目前,字节跳动和快手均有布局AI大模型和生产式AI。其他头部科技公司中,腾讯、阿里巴巴、华为也在行动。2022年4月,腾讯对外披露“混元”大模型,协同了腾讯预训练研发力量,覆盖NLP(自然语言处理)大模型、 CV(机器视觉)大模型、多模态大模型及多个领域任务模型。2022年9月,阿里巴巴在世界人工智能大会上,发布 “通义”大模型系列,并宣布相关核心模型向全球开发者开源。华为云团队于2021年4月发布“盘古”大模型, 2022年11月,在华为全联接大会2022中国站上,华为云发布盘古大模型的新技术能力,扩展盘古大模型的服务范围,发布盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项新服务。ChatGPT火了之后,中国不少公司都在尝试研发类似产品。但这件事成本极高。OpenAI每年的研发费用高达几十亿美元,GPT-3.5语言大模型包含1750亿个参数,微软为ChatGPT构建了超过1万枚英伟达A100GPU芯片的AI计算集群。GPT-4的参数值在此基础上又大幅提高。谷歌3月6日推出的多模态大模型PalM-E,参数值达到了5620亿。一位长期关注AI的投资人告诉《财经》记者,中国的创业公司从零去做类似产品,非常不划算,也很难追赶进度,应该将重心放在行业应用上。另一位投资人提到,由于监管因素,文心一言为代表的国产替代产品未来才是主流。文心一言的出现,或许能够帮助中国公司更好地理清思路。李彦宏称,对于大部分创业者和企业来说,新的机会在于基于通用大语言模型,抢先开发重要的应用服务。“就像移动互联网时代,最成功的商业产品不见得是安卓和iOS,而是基于安卓和iOS开发的微信、淘宝、抖音等各种超级应用。”星标我们 了解更多财经独家资讯
