有个异事儿买球下单平台,前段工夫,大模子竞技场上,一位代码为sus-column-r 的匿名模子横空出世。
该基金的基金经理为段吉华,段吉华于2022年12月2日起任职本基金基金经理,任职期间累计回报10.79%。
该基金的基金经理为王玥、朱柏蓉、茹昱,基金经理王玥于2024年3月1日起任职本基金基金经理,任职期间累计回报1.61%。基金经理朱柏蓉于2019年1月30日起任职本基金基金经理,任职期间累计回报21.61%。基金经理茹昱于2024年7月2日起任职本基金基金经理,任职期间累计回报0.63%。
没东说念主知说念它师出何门,但在昔日的一个月里,它却称得上是过五关斩六将。。。
累计一万多东说念主的投票,硬生生让它挤进了排名榜前方。到当今,笼统智商照旧和 5 月 13 号发的GPT-4o ( API 版块)并排第三了。
看这势头,其时就有不少东说念主推断,这可能是 OpenAI 阿谁迟迟没向大家公布的,深奥的“草莓 Q* ”格式。
然而,就在昨天,这个困扰大伙儿很久的密语,终于有谜底了。但解开它的,不是 OpenAI ,而是庸俗被公共忽略,但也在搞 AI 的马斯克。
这个匿名的 sus-column-r 模子,其实即是 xAI 要推出的新模子 Grok2,当今照旧上线会员版的 X 了。
而之是以在大模子竞技场上整这样一出,说白了,是想给昨天的发布热热场子。
像是在官宣推出 Grok2 的博客里,就后堂堂地展示了之前 sus-column-r 积贮的战绩,甚而还作念了对降服率表。
按照他们自个儿的说法,表内部除了谷歌的 Gemini 1.5 Pro 外,其余不管是 GPT-4o ,如故 Claude3.5 Sonnet ,都只但是 Grok2 的“辖下败将”。
诚然了,其他的纸面收货, Grok2 答得也挺可以。光从各个基准的数据来看,它的各项智商,都和市面上着手进的 AI 差未几,这一线大模子的行列,也算是被 Grok 给挤进去了。
不外辞世超的范例里,一个模子好不好,光看这些数据也还不成,最进军的是,得看大伙们的实质使用体验。
相较于前次的还只可翰墨开开打趣的Grok1.5,此次Grok2最光显的一个升级,即是新增了图片功能。
但和其他家我方着手搞多模态 AI 不一样,此次马斯克倒挺陌生地礼聘了和别东说念主相助。
相助的对象,差友们应该还有点印象,即是前两天咱刚写过的FLUX.1 。
看到这,世超也没对 Grok2 的图片功能抱太大的期待,毕竟是前脚刚试过的 AI 。。。
但没预见集成到 Grok2 内部的 FLUX.1 ,还真撞出了一丝不一样的火花。
倒也不是说,在性能上它通宵之间飙升了一大截。而是相较于市面上的其他图片 AI , Grok2 的整活智商可以称得上是一骑绝尘。
雷同是迪士尼公主的一个提醒词, Grok2 在标准上就比其他模子要果敢的多。
而况, Grok2 还能告成对着我方的雇主恶搞,比如这是一个爱吃甜品,吃到发胖的马斯克。
转瞬,他还能穿越到职权的游戏里,玩扮装演出。
更搞的是,还有网友告成拿 Grok2 生成的图,和视频 AI 配合起来,作念起了视频。
不外, Grok2 这样堂堂皇皇地恶搞各式公世东说念主物、卡通东说念主物,风险详情如故有的。
像是有网友生成马里奥吸烟喝酒、不雅望“ 911 ”事件的图片,就照旧有东说念主督促任天国告状了。
除了新增有图片功能外, Grok2 此次升迁的基础智商,咱详情也得上手测测,望望实力。
商酌到咫尺 X 上线的,还仅仅性能差一丝的小杯 mini 版,于是世超在大模子竞技场上,试用了下智商更强的 Grok2 ,还拉来了最新版块的 GPT-4o 作相比。
比试第一招,先从 AI 容易犯错的题目启动。前段工夫,大模子集体在“少许相比”上翻车,大伙应该都传说过了。
此次再来波经典重现,让它俩来比比9.5 和 9.11 的大小。
没预见的是, GPT-4o 依旧是死性不改,效果对了,但一看解题念念路,王人备即是一塌微辞。反倒是 Grok2 倒有理有据,给出了正确谜底。
还有经典的数数问题, GPT-4o 依旧让东说念主大跌眼镜,“我一把把把把住了”它居然数出来 5 个把字, Grok2 这边倒如故褂讪推崇。
不外紧接着问它俩这句话的真义, Grok2 就有点露怯了,瞎说了一大堆,没一个踩到得分点。而此次 GPT-4o 粗陋几句话就给讲解澄莹了。
接下下世超又试了一些相比基础的知识性问题,比如说“李政说念是谁”,它俩回应的,都还算正确。即是不知说念为啥, GPT-4o 很容易犯懒,草草几句话就适度了。
而 Grok2 这边,每次给出得谜底都挺详备,还贴心肠分了类。
归正世超在实质用的时候,是真有嗅觉到 Grok2 智商的升迁。
另外,按照官方给的数据,此次 Grok2 在数学这块儿,也能算得贼溜了。
于是我就又翻出了之前 Grok 作念错的那说念数学题,是全部求导的问题。
效果马斯克还真没忽悠咱,它俩都把这说念题给整瓦解了。
而把 Grok 奶成当今的样子,马斯克在背后出牛逼可不啻一星半点儿。
但有真义的是,马斯克主打的,即是薅我方其他公司的羊毛。。。
先是职工这块儿, xAI 系数就唯有 50来个职工,其中有 11 个都是在特斯拉使命的,而况内部还有 6 个是在 Autopilot 团队使命的,是一丝儿都不想避嫌。
据华尔街日报音尘,甚而蓝本要给特斯拉用的 GPU ,也被马斯克条目优先供应给 xAI ,还毫无所惧的说,特斯拉当今也没地儿用,在仓库里放着亦然放着。
偷完特斯拉的家,还不外瘾,马斯克把手也伸到了 X 上。
就在前两天,科技媒体 Techcrunch 称,为了“偷偷”用用户们的数据考试 AI , X 在更新的时候,还偷摸着把用户的默许栽植给改了,而况要关掉还得挑升登录网页版。。。
不外总这样偷家,不免会吃上讼事。像是马斯克和他的 X ,就被特斯拉的鼓励,还有好几个国度的数据保护机构给告状了。
咫尺,对于特斯拉的案件,照旧在特拉华州的一个法院审理了。
而另外几个数据保护机构,也把 X 告得,暂停用用户数据考试 Grok 了。甚而 X 还有可能遭到“ 4%平台交易额”的罚金。
但不管如何,在大模子这块儿,马斯克的 Grok 也算是着实赶上公共伙的经由了。和其他大模子比,不管是图片生成,如故其他基础智商上, Grok2 都不算差,甚而还整出了一丝儿我方的特点。
据说, xAI 下一步会把 Grok 更深切地揉到 X 平台上头,而况还要再发一个多模态知晓的预览版 AI 。
不知说念为啥,世超照旧有点期待,马斯克还能整出什么花活儿来了。。。
撰文:松鼠
剪辑:江江
好意思编:
图片、贵府来源:
X、WSJ、Techcrunch买球下单平台
Grok世超模子马斯克特斯拉发布于:浙江省声明:该文不雅点仅代表作家本东说念主,搜狐号系信息发布平台,搜狐仅提供信息存储空间劳动。