王小川 图源:百川智能
“在美国做开源大模型或做通用已没有悬念,投资也已经明确,但在中国不是,国内谁能做最好的大模型现在没有定论,大家都有争取的机会,而且不一定落在大厂里面。”百川智能首席执行官王小川在8月8日媒体发布会现场如是说。
【资料图】
据《中国人工智能大模型地图研究报告》显示,截至5月28日,国内10亿级参数规模以上基础大模型至少已发布79个。如果回溯至谷歌2017年发布Transformer网络结构之时,在五年时间内全球已诞生了若干形态各异、落地于不同场景的大模型技术群。
8月8日下午,百川智能宣布发布公司旗下第三款大模型产品Baichuan-53B,开启第一批内测。同时,王小川接受了界面新闻等媒体的采访。
此前,百川智能在7月11日发布了参数量为130亿的通用大语言模型Baichuan-13B-Base和对话模型Baichuan-13B-Chat的两个量化版本。这个发布意味着,成立仅4个月的百川智能已经推出了三款大模型产品,速度之快令人咋舌。
虽然三款大模型的命名都以百川开头,但王小川特别指出,这些大模型并非定位为2C终极的沙盒型产品,他们本质上更多是为2B服务。
在8日下午,百川智能第三个模型baichuan-53B启动了首批内测服务,界面新闻记者经测试发现,这款产品在回答最新且稍有难度的问题时,表现出了很强的逻辑性。
据王小川所述,baichuan-53B更大的能力是能很好理解语言泛化背后的含义,这款产品代表文科水准的抽象、类比和关联能力很强,能把各种概念有机连接,“我们这个模型在文科领域走前列。”王小川认为。
事实上,强文科能力的大模型体现了王小川的技术审美,他本人在4月创业之初一场采访中就提及,逻辑本身并不高级,更高级的人类智慧在类比和抽象之中,像分类、类别这种事情,ChatGPT就做得挺好。
B端的抉择
但无论是此前搜狗团队在语言能力上的积累,还是新产品在文法、修辞、逻辑学方面的惊艳表现,百川智能的模型并不面向2C。虽然在2B以外,百川团队已在部署包含2C的超级应用,但王小川强调,现在开放接口测试是为帮助大家在工作上取得进展,不为C端场景单独去做优化,“不管之前的7B与13B,还是53B,更多是为2B行业做准备。”下月,baichuan-53B会开放API,相关组件也会陆续开放。
这一细节表述引发了2B2C模型在同一公司内部站位的迷思。
就在近日,有头部VC相关投资人告诉记者,一级市场现在并不看好针对2B垂直领域的模型,因为在数据上很难构成壁垒。对此,王小川对界面新闻表示,B端大模型天花板确实不高,但确定性反而清楚,很多企业有B端需求,只是对接复杂性高,研发成本高,每个企业有自己的私有数据,如何做好中间层连接尤为关键,如果没有一个好的模式,会把双方都拖垮。他同时给出了一个B端大模型商业模式的愿景,“B端带有天然真实场景,有中间层做企业服务,也有后面做模型的公司(比如我们),我理解的是这样的三层结构。”王小川指出。
但他也告诉界面新闻等媒体,当2B补完之后会开始补齐2C版图,百川智能不会只瞄准一个方向。
当前侧重B端的站位也解释了王小川在开闭源上的选择,他称,大模型本身不代表2C,就不像像安卓、IOS需要二选一,今天从2B的角度,其实开源闭源都很需要。
据媒体报道,是今年3月大模型热潮兴起之后,王小川用2周时间做了入局大模型创业的决定,在这个时间节点上,少数几家头部大模型公司如智谱AI和MiniMax已经声名鹊起。
王小川坦言,相比智谱AI和MiniMax等已经具备一定市场影响力的大模型公司,百川智能是后发者进入市场,因此开源是展现技术实力的一种方式,“我们相信后面的技术发展会非常快,只要持续不断有技术迭代,就会产生自己的商业模式。”王小川很看重开源带来的价值,他认为,未来80%的企业会用到开源模型,因为开源模型小巧,而闭源没法对很多场景做出上佳适配。
今年3月以来,国内各类ChatGPT平替大模型层出不穷,进展之快令人混乱,与之相伴而来的是评测体系的构建。7月,IDC调研了14家中国市场主流大模型技术厂商,考察了大模型的10余项指标,发布《AI大模型技术能力评估报告2023》,随即引发热议,此后,更多研究机构投入资源,发布对应的评价标准。
王小川认为,在各家榜单之中,Super Clue和复旦大学推出的评测基准相对中正,可以从中洞察模型品质。据他所述,百川推出的第二款大模型13B的英文能力部分跟Meta的开源大模型LLaMA1持平,中文部分更在国内处于领先状态,这都受益于开源的迭代。
重集旧部
7月下旬,搜狗原CMO洪涛入职百川智能,负责商业化业务,至此,搜狗前CEO王小川、搜狗原COO茹立云和原CMO在百川智能重新聚首。在8月8日媒体发布会现场,还出现了另一位搜狗旧部的身影——前搜狗搜索总经理陈炜鹏,后者是百川智能的技术联创核心人物,百川智能得以在4个月间连推三款大模型产品,他功不可没。
王小川感慨,搜狗老班底之间,大家互相信任,会更优先归队,“像炜鹏、洪涛、立云,还有马昭都是老班底。”王小川介绍称。
目前,百川智能有103位成员,技术人士占比70-80%。技术联合创始人陈炜鹏对界面新闻表示,搜狗之前各个业务线最优秀的干将如今基本在百川集结完毕,但百川同时也在面向国内大厂、初创和硅谷招聘各类人才,他发现,在时代,对产品经理等职位的能力要求已与时代有显著不同。
谈及百模大战时代筛选技术人才的标准,陈炜鹏称,百川在技术上倾向于两类人才,第一是对复杂问题有强拆解能力,对算法体系有很好的技术审美;第二是各类技术基本功扎实,且对于做大模型本身充满渴望。
融资进展方面,4月成立之初,百川智能便被爆出已获得5000万美元启动资金,来自王小川与其业内好友的个人支持。王小川此番还透露,百川智能首次融资时,估值已经超过5亿美元,下一轮融资,估值就会超过10亿美元,目前新一轮融资也非常顺利。
界面新闻注意到一个现象,以王小川、王慧文同期创业为节点,此前是智源系的大模型公司占据些许先发优势,在王小川等互联网时代的大佬宣布创业后,资本立即表达了对“单打独斗”的AGI明星创业者的高度认可。而进入7月,一级市场暗流涌动,一些投资人牵头,AI大佬组团入局的事件开始酝酿。
对于可能面临的更为惨烈的竞争,王小川认为,一家公司需要灵魂,现今创投两侧的各类攒局者其实夹杂着诸多对技术的误解,比如之前对搜索的理解,明显有各种误判,“不论是(外界)希望由技术驱动或者内容驱动,至少从我20年的工作经验里,我觉得他们解读的还是比较浅的,”王小川还点出了他心目中搜索的本质,“以前在AI发展时期,大家慢慢遗忘搜索也是AI,而今天做大模型和做搜索有非常雷同之处。”
王小川图源:百川智能“在美国做开源大模型或做通用已没有悬念,投资也
赛迪百强区发布:“东强西弱”格局缓解,中部崛起势头强劲
氧立方城市福地怎么样?海南氧立方城市福地还能升值吗?氧立方城市福地
记者靖亚如沈壮8月8日,《枣庄市锂电产业发展促进条例》颁布新闻发布会
能链智电周二美股收涨13 86%,报6 16美元。
华商网要闻频道是整合华商报媒体资源,为陕西用户提供24小时全面及时的
直播吧8月9日讯罗马诺报道,巴萨总监阿莱曼尼在采访中确认,登贝莱加盟
直播吧8月8日讯中超第21轮,海港vs海牛第32分钟,武磊获得单刀面对门将
大家好,小福来为大家解答以上的问题。小狗一直拉稀怎么办啊,小狗一直
1、哦。2、他称号?。本文到此讲解完毕了,希望对大家有帮助。
1、京投发展上榜原因:跌幅偏离值达7%的证券。截止收盘,京投发展报收7
湘阴樟树港辣椒。华容芥菜。红网时刻岳阳8月8日讯(记者肖懿实习生李思
近日,衢州常山县民政系统安全工作会议在县民政局召开,县政府副县长黄
8月3日,开封市祥符区仇楼镇举办巩固拓展脱贫攻坚成果同乡村振兴有效衔
智能小家电上升空间大!北交所迎来厨房小家电第一股, 中国家电,是
“感谢你们来到我们家乡,救我们的家乡人,我们涿州受灾了,好多人都没
万人说新疆|方寸之间铸匠心
收钱吧正在和火山引擎数智平台(VeDI)跑出一条业务提效新通路。
巍巍青山过,浩浩江水流。昭通市巧家县,一个地处深山峡谷的小县,因为
太平洋证券股份有限公司王亮王海涛周冰莹近期对再升科技进行研究并发布
7月份的上汽大众,算是勉强度过了一个安稳月。从乘联会公布的7月新能源
财政政策在稳增长作用的发挥上被寄予厚望,但政治局会议也强调了,重点
中年女人,是指年龄介于40岁到60岁之间的女性,是一个充满了生活经
2023年8月8日,宇新股份( 002986)发布持股5%以上股东减持股份计划期
某些北美地区的AudiRS5Coupe组装过程中发生内部处理错误,引发了召回事
1、崇文尚学教育培训费据我所知费用还是比较划算的,可分期付款挺人性
8月8日,据中国华能官网消息,8月6日,山东德州市平原县发生5 5级地震
兴蓉环境:垃圾焚烧发电项目尚未获得绿电证书
御天剑道如何快速升级御天剑道快速升级方法介绍,
据韩联社报道,据韩国警察厅国家侦查本部8月7日消息,截至当天下午6时
广告
X 关闭
广告
X 关闭
管好居家“神兽” 家长应先“自救”
疫情中的导游危中寻机
花钱就能“随心改”?代改IP地址暗藏隐私泄露风险
网上N95、KN95口罩宣传花样太多 信科学别信忽悠