栏目分类
发布日期:2025-01-17 06:19 点击次数:100
图片来源:企业官方
蓝鲸新闻12月19日讯(记者 朱俊熹)字节高出再卷AI模子价钱。在12月18日举办的火山引擎Force大会上,字节高出矜重发布豆包视觉贯通模子,输入价钱为0.003元/千tokens。继通用大模子后,多模态模子也由以分计价迈入以厘计价的阶段。
据字节旗下云奇迹平台火山引擎先容,豆包视觉贯通模子的订价比行业价钱低85%,绝顶于一元钱就不错贬责284张720P的图片。与国表里其他具备多模态才略的大模子比较,OpenAI GPT-4o的输入价钱为0.0175元/千tokens,Anthropic的Claude 3.5 Sonnet订价为0.021元/千tokens,阿里Qwen-Vl-Max为0.02元/千tokens。
本年5月,字节高出在矜重对外发布豆包大模子时,就曾因订价比同业低99.3%而掀翻波浪。阿里云、百度、腾讯等头部厂商很快紧随后来,纷繁布告跟进降价,燃起了国内大模子价钱战。在廉价的驱动下,大模子的欺诈也开动加快。火山引擎数据自满,为止现在,豆包通用模子的日均tokens使用量已越过4万亿,较初度发布时增长了33倍。
火山引擎总裁谭待在领受媒体群访时提到,跟着模子本钱大幅镌汰、后果得到擢升,近半年来商场上关于模子使用的响应才多了起来,开动更温顺模子调用量、token数。他在演讲时暗示,“咱们但愿用一个合理的、可络续的,关键是一步到位的价钱,让企业和开荒者不错闲隙斗胆地去使用,去作念多模态。”
新推出的豆包视觉贯通模子八成精确识别视觉执行,同期具备贯通和推理、视觉形容等才略。在现场示例中,该模子不错识别动物的影子笼统、杂志内页的星云、体检施展的某项具体盘算。其欺诈场景可能包括造就方面的判卷引导、作文删改,或旅游、电商营销等规模。
谭待称,字节高出在类o1的推理模子规模相同有所布局。在解答数学、物理、代码问题上,豆包视觉贯通模子已具备此类才略的雏形。完好版推理模子会在进一步完善后推出,“不会太久”。
除字节外,国内也有大模子公司在视觉标的取得新进展。12月16日,独角兽月之暗面发布视觉想考模子k1,主推既能通过视觉精确识别,又能散播推空想考,在数学、物理、化学等评测中阐扬开端。上周,私募巨头幻方量化旗下的AI公司DeepSeek开源全新视觉模子VL2。该公司称,视觉是东谈主类获取外界信息的主要来源,在大模子方面的进展却远远落伍于谈话模子,擢升模子视觉才略的意思意思意思意思更在于全所在擢升其感知和贯通才略。
在这次火山引擎举止中,字节高出还发布了豆包3D生成模子,多款产物迎来更新。其中,豆包通用模子pro已全濒临都GPT-4o,使用价钱为后者的1/8。音乐模子的撑持时长从60秒升级至3分钟,文生图模子2.1版块八成终了精确生成汉字、一句话P图等产物化才略。字节瞻望,来岁春季将推出具备更长视频生成才略的豆包视频生成模1.5版,并很快上线端到端及时语音模子。
谈及对大模子翌日落地场景的判断时,谭待称AI对话是一个通用的场景,但大模子在分娩力、交易化场景中的增速并不慢。以近3个月为例,豆包大模子在信息贬责场景的调用量增长了39倍,客服与销售场景增长16倍。“聊天功能是一个很基础的功能,得加上深度推理、视觉贯通等功能才能贬责更复杂的任务。而这才是模子之后发展空间越来越大的前提,视觉对大模子的调用量和场景会带来很大的匡助。”谭待暗示。
在谭待看来,商场仍处于早期,比起竞争会更关注用户对复杂谈话场景、视觉等方面的需求。与互联网期间C端先于B端崛起不同,大模子的这两个方面并不是割裂的,其背后都基于相同的模子才略。因此,字节对大模子的判断是To B和To C都头并进。
对火山引擎这一双外敞开字节技艺器具的云厂商而言,AI成为了新的增长契机。谭待暗示,拉升火山引擎商场份额的关键在于两点。一是范畴上风,作念到范畴大、弹性高、本钱低廉,企业会自联系词然地移动过来或作出选择。而火山引擎的上风是从初期起,就将字节旗下抖音、本日头条的里面范畴与外部范畴结伙起来成立。其次,要把执住AI大模子这一技艺变革,通过豆包获取更多关注和新的谐和契机。
谭待并未显现云收入受大模子带动的具体数据,仅对使用大模子的客户数目、使用过程给以了详情的评价。“从云原生到AI云原生,火山但愿作念成这块的领军企业。”他暗示。