无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > AI最新資訊  > 正文

    B站UP主用“弱智吧”測試AI智商 整活視頻獲贊超71萬

    2023-11-08 14:44 · 稿源:站長之家

    站長之家(ChinaZ.com)11月8日 消息:不得不說,網(wǎng)友真的太會整活了。11月3日,B站UP主“精致的男孩富貴”展示了國內(nèi)大型語言模型的智商測試。他以一種輕松幽默的方式挑戰(zhàn)了這一強(qiáng)大的技術(shù)。

    在這個視頻中,UP主選擇了“淘寶問問”和“文心一言”這兩個典型的互聯(lián)網(wǎng)平臺,以它們作為代表進(jìn)行測試。他提出了一系列看似毫無意義的問題,例如,“神父去世了算升職還是降職?”或者“天上有9個太陽的時候,向日葵應(yīng)該往哪里看呢?” 這些問題都源自于一個著名的互聯(lián)網(wǎng)段子社區(qū)“弱智吧”。

    image.png

    許多網(wǎng)友戲稱“弱智吧”實(shí)際上是中國人的“圖靈測試”,因?yàn)樗砸环N令人困惑的方式考驗(yàn)了人工智能的智能水平。UP主的目標(biāo)是查看大型語言模型是否能夠理解這些抽象但嚴(yán)肅的問題,以及是否能夠提供有意義的答案。

    然而,結(jié)果卻讓人大吃一驚。即便面對這些毫無邏輯的問題,人工智能也可以一本正經(jīng)地瞎扯淡。這顯示出大型語言模型在邏輯推理方面存在明顯不足。盡管這些問題看似無厘頭,但它們含有大量的邏輯陷阱,而大語言模型的答案正確率反映了其邏輯能力的局限性。

    截至發(fā)稿時,UP主的視頻已經(jīng)獲得了超過71.1萬的播放量,并收獲了6.6萬的點(diǎn)贊。在評論區(qū),眾多網(wǎng)友也積極分享了他們與人工智能互動的經(jīng)歷,使用“弱智吧”的段子挑戰(zhàn)大型語言模型的智能。

    UP主最后指出,通過使用更多的數(shù)據(jù)和改進(jìn)的算法,可以提高模型的推理和決策能力?;蛟S在未來的某一天,人工智能將能夠勝過“弱智吧”,并提供更有趣和有意義的回答。這個視頻引發(fā)了對人工智能能否應(yīng)對復(fù)雜邏輯和無厘頭問題的深刻思考,也讓人們對技術(shù)的發(fā)展充滿了期待?;ヂ?lián)網(wǎng)的精彩之處在于,它不斷引領(lǐng)著我們走向未知的未來。

    舉報

    • 相關(guān)推薦
    • B:2024年近310UP主獲得收入

      快科技4月9日消息,今晚B站發(fā)布《2024年環(huán)境、社會及管治報告》,內(nèi)容指出創(chuàng)作者是B站社區(qū)的核心。2024年有近310萬UP主在B站獲得收入,創(chuàng)作者通過各類廣告產(chǎn)品及增值服務(wù)業(yè)務(wù)獲得的總收入同比增長21%。商業(yè)化工具 花火”商單平臺助力UP主與品牌深度合作,2024年通過花火商單獲得收入的 UP 主數(shù)量同比增長33%;通過視頻及直播帶貨獲得收入的UP主數(shù)量同比增長68%。同時,B站也不斷拓展各類增值服務(wù)產(chǎn)品,助力各類型UP主根據(jù)自身內(nèi)容特色選擇最適合的變現(xiàn)方式。以充電計劃為例,2024年,超過800萬用戶為UP主進(jìn)行充電付費(fèi),UP主通過充電計劃獲

    • 百萬、輕松變現(xiàn)?AI視頻是“風(fēng)口”還是“騙局”

      用AI做短視頻獲贊百萬、漲粉幾十萬,門檻低還輕松變現(xiàn)?AI熱潮之下,短視頻平臺上出現(xiàn)了許多用AI制作的賬號:用Deepseek寫文案,用即夢做圖、生成視頻,再用剪輯軟件進(jìn)行編輯。尤其是今年以來、利用AI生成古人形象、配上養(yǎng)生內(nèi)容的“AI養(yǎng)生”十分火熱。然而,這類賬號真的那么容易上手嗎?普通人到底能不能賺到錢?或許,比起“挖礦”的,行動更快的是“賣鏟子”的人。AI?

    • B四成的90/00后選擇購買20以上的汽車

      調(diào)查顯示,超過四成的90后和00后在購車時傾向于選擇20萬元以上的汽車,反映出年輕消費(fèi)者在購車時更加注重車輛品質(zhì)、性能和品牌價值,而不僅僅是價格。這一趨勢表明,汽車市場正在向高端化、智能化方向發(fā)展,也體現(xiàn)出年輕一代消費(fèi)能力不斷增強(qiáng),他們更愿意為高品質(zhì)的產(chǎn)品支付更高的價格。

    • 30的LV包包,成本僅1萬?揭露奢侈品“溢價”視頻走紅海外SNS

      工廠的相關(guān)人員表示, Birkin 包價格中 90% 都是 “愛馬仕的品牌溢價”……

    • AI時代的B長什么樣

      每個時代每個領(lǐng)域都有代表性的頭部應(yīng)用。下一個時代該領(lǐng)域的頭部應(yīng)用,通常不會出自上一個時代的頭部應(yīng)用。未來二次元的頭部應(yīng)用的種子,正在“邊境”地區(qū)孕育、發(fā)芽,它們或許是名不見經(jīng)傳的小公司,或許是大廠里被冷落的一個小部門,一切需要時間去見證。

    • 百度宣布3年開放2.1萬個校招實(shí)習(xí)崗:還要培養(yǎng)AI技術(shù)大佬

      百度招聘官宣,未來三年,百度將開放21000個實(shí)習(xí)崗位給優(yōu)秀校園人才,并持續(xù)加強(qiáng)對實(shí)習(xí)生的培養(yǎng),進(jìn)一步提升實(shí)習(xí)轉(zhuǎn)正率。據(jù)介紹,今年3月,百度已面向在校學(xué)生開放3000暑期實(shí)習(xí)崗位,87%與AI相關(guān),覆蓋大模型、機(jī)器學(xué)習(xí)、無人駕駛等領(lǐng)域。此外,百度今年也將啟動管理培訓(xùn)生計劃、AIDU計劃,面向AI領(lǐng)域招募頂尖校園人才,致力于培養(yǎng)AI時代核心

    • “吉卜力風(fēng)格”熱潮下, 7 億人的“臉”正被用于AI訓(xùn)練?

      站長之家4月8日消息:隨著ChatGPT的圖像生成功能持續(xù)獲得爆發(fā)式人氣,人們開始擔(dān)心自己上傳的照片等數(shù)據(jù)會被OpenAI收集、并被用于AI學(xué)習(xí)。據(jù)韓國移動數(shù)據(jù)平臺IGAWorks在8日發(fā)布的數(shù)據(jù)顯示,在吉卜力風(fēng)格圖片生成功能大行其道的一周時間里,ChatGPT在韓的每日活躍用戶數(shù)從125萬增長到了308萬,漲幅高達(dá)2.5倍。業(yè)內(nèi)律師表示,“從OpenAI的角度來看,完全可以借此積累各種年齡、種族、性別的臉部圖像數(shù)據(jù)”,他還補(bǔ)充道,“如果不想在因?yàn)楹猛嫔蟼髡掌?,泄露了個人信息的話,就應(yīng)該將其設(shè)置為不允許AI利用其個人隱私進(jìn)行訓(xùn)練學(xué)習(xí)”。

    • B喜馬紛紛入局,年輕人需要“能看”的視頻播客嗎?

      B站近期積極布局視頻播客領(lǐng)域,邀請《無聊齋》《故事FM》《忽左忽右》等頭部播客節(jié)目入駐,并提供流量和現(xiàn)金激勵。3月26日上線首檔自制視頻播客《一麥三連》,采用錄音棚對談形式,首期播放量超150萬。喜馬拉雅也推出視頻播客《行走的思考》,累計播放589萬次。目前國內(nèi)視頻播客可分為四類:圓桌對談型(如《一麥三連》)、遠(yuǎn)程連線型(如TIANYU2FM)、動畫型(如《菠蘿油子》)和紀(jì)錄片型(如《行走的思考》)。雖然視頻播客制作成本高、周期長,但平臺支持和廣告主需求正推動創(chuàng)作者嘗試。數(shù)據(jù)顯示,美國30%播客聽眾通過YouTube收聽,而國內(nèi)用戶對播客的認(rèn)知仍以音頻為主。頭部播客多因平臺政策推動視頻化,中小創(chuàng)作者則更主動嘗試。視頻播客能否改變中文播客"小眾"認(rèn)知,帶來新商業(yè)可能,仍需觀察。(140字)

    • DeepSeek上新!開源發(fā)布DeepSeek-Prover-V2-671B新模型

      快科技4月30日消息,今日,DeepSeek 今日在 AI 開源社區(qū) Hugging Face 發(fā)布了一個名為 DeepSeek-Prover-V2-671B 的新模型。據(jù)介紹,DeepSeek-Prover-V2-671B 其參數(shù)量達(dá)到6710億,使用了更高效的 safetensors 文件格式,并支持 BF16、FP8、F32 等多種計算精度,方便模型更快、更省資源地訓(xùn)練和部署。在模型架構(gòu)上,該模型使用了DeepSeek-V3架構(gòu),采用MoE(混合專家)模式,具有61層Transformer層,7168維隱藏層。同時支持超長上下文,最大位置嵌入達(dá)163840,使其能處理復(fù)雜的數(shù)學(xué)證明,并且采用了FP8量化,可通過量化技術(shù)減小模型大小,提

    • 深夜突襲,DeepSeek-Prover-V2加冕數(shù)學(xué)王者!671B數(shù)學(xué)推理逆天狂飆

      DeepSeek發(fā)布數(shù)學(xué)推理模型DeepSeek-Prover-V2,包含7B和671B兩個參數(shù)版本。該模型采用"遞歸+強(qiáng)化學(xué)習(xí)"訓(xùn)練方法,在MiniF2F測試集上達(dá)到88.9%通過率,解決了PutnamBench中的49道題目。關(guān)鍵技術(shù)包括:1) 使用DeepSeek-V3分解復(fù)雜定理生成子目標(biāo);2) GRPO算法從多個候選方案中自動學(xué)習(xí)最優(yōu)解;3) 通過思維鏈整合非形式化推理與形式化證明。模型在AIME競賽題和教科書題目上也表現(xiàn)優(yōu)異,7B小模型意外在部分問題上超越大模型。論文指出該方法為通向AGI提供了正確路徑,未來將擴(kuò)展至IMO級別數(shù)學(xué)難題。