RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌公布基礎(chǔ)模型Genie,主攻2D平臺(tái)類游戲及機(jī)器人應(yīng)用

微云疏影 ? 來(lái)源:綜合整理 ? 作者:綜合整理 ? 2024-02-28 10:02 ? 次閱讀

在OpenAI研發(fā)出Sora后不久,谷歌Deep Mind團(tuán)隊(duì)公開(kāi)了在世界模型領(lǐng)域的新進(jìn)展——基礎(chǔ)世界模型Genie。該模型主要借鑒非對(duì)抗方式進(jìn)行訓(xùn)練,可根據(jù)各類圖像乃至草圖生成具有豐富動(dòng)作表現(xiàn)的2D世界,從而實(shí)現(xiàn)人們與虛構(gòu)世界的深度互動(dòng)。只需輸入一張圖像,Genie便可構(gòu)建一個(gè)全新的交互環(huán)境。

DeepMind指出,Genie有能力根據(jù)最新的文生圖大模型生成初始幀,再借助Genie的能力賦予這些圖像更深層次的含義。Genie作為一個(gè)包含110億參數(shù)的基礎(chǔ)世界模型,成功研發(fā)得益于谷歌聲名在外的潛在動(dòng)作模型,用于推斷視頻幀間的運(yùn)動(dòng),視頻分詞器則可以將原始視頻幀轉(zhuǎn)化為離散標(biāo)記,而動(dòng)態(tài)模型則負(fù)責(zé)預(yù)測(cè)下一幀的活動(dòng)情況。

值得注意的是,相較于號(hào)稱“高清晰度、高真實(shí)感”的Sora, Genie似乎更注重潛在行為的預(yù)測(cè),而不是極力展現(xiàn)畫面的真實(shí)性?,F(xiàn)階段,從圖像或文本中生成高質(zhì)量視頻尚未成為Genie關(guān)注的核心業(yè)務(wù)點(diǎn)。DeepMind進(jìn)一步透露,Genie主要圍繞“2D平臺(tái)類游戲及大約率算法”展開(kāi)應(yīng)用,這種處理方法具有廣泛適應(yīng)性,可應(yīng)用于各領(lǐng)域,也可以擴(kuò)展至更大規(guī)模的互聯(lián)網(wǎng)數(shù)據(jù)集。

然而,這個(gè)還在試驗(yàn)階段的Genie尚不能視為商業(yè)產(chǎn)品問(wèn)世。據(jù)DeepMind人士解釋,Genie的訓(xùn)練視頻為160x90像素且每秒僅10幀的超低分辨率視頻,生成的模擬游戲以每秒1幀的速率運(yùn)行。因此,實(shí)際場(chǎng)景更為復(fù)雜且要求更高實(shí)時(shí)性的商業(yè)應(yīng)用仍需耐心等待解決方案。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • DeepMind
    +關(guān)注

    關(guān)注

    0

    文章

    130

    瀏覽量

    10838
  • genie
    +關(guān)注

    關(guān)注

    0

    文章

    7

    瀏覽量

    4282
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1074

    瀏覽量

    6471
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2410

    瀏覽量

    2624
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Google DeepMind發(fā)布Genie 2:打造交互式3D虛擬世界

    在OpenAI宣布即將發(fā)布新模型和新功能后,Google DeepMind也不甘落后,于近日推出了大型基礎(chǔ)世界模型——Genie 2。這款模型
    的頭像 發(fā)表于 12-05 14:16 ?379次閱讀

    【書(shū)籍評(píng)測(cè)活動(dòng)NO.51】具身智能機(jī)器人系統(tǒng) | 了解AI的下一個(gè)浪潮!

    情況為例,具身智能機(jī)器人的核心元器件(包括 3D 視覺(jué)傳感器、六維力傳感器、微型傳動(dòng)系統(tǒng)、靈巧手與精密力控系統(tǒng)、高性能 驅(qū)控關(guān)節(jié)模組、融合通用大模型、機(jī)器人算力底座 AI 芯片、具身行
    發(fā)表于 11-11 10:20

    引領(lǐng)通用具身新時(shí)代:普渡發(fā)布首款人形機(jī)器人PUDU D7

    深圳2024年9月19日?/美通社/ -- 9月19日,全球服務(wù)機(jī)器人領(lǐng)軍企業(yè)普渡機(jī)器人正式發(fā)布其初代人形機(jī)器人PUDU D7?;诜律p
    的頭像 發(fā)表于 09-20 09:07 ?531次閱讀
    引領(lǐng)通用具身新時(shí)代:普渡發(fā)布首款<b class='flag-5'>類</b>人形<b class='flag-5'>機(jī)器人</b>PUDU <b class='flag-5'>D</b>7

    智能移動(dòng)機(jī)器人

    富唯智能移動(dòng)機(jī)器人分為復(fù)合機(jī)器人和轉(zhuǎn)運(yùn)機(jī)器人,搭載ICD核心控制器,實(shí)現(xiàn)一體化控制,最快可實(shí)現(xiàn)15分鐘現(xiàn)場(chǎng)機(jī)器人的快速部署,無(wú)縫對(duì)接產(chǎn)線,配合自研2
    的頭像 發(fā)表于 08-27 17:22 ?329次閱讀
    智能移動(dòng)<b class='flag-5'>機(jī)器人</b>

    Al大模型機(jī)器人

    金航標(biāo)kinghelm薩科微slkor總經(jīng)理宋仕強(qiáng)介紹說(shuō),薩科微Al大模型機(jī)器人有哪些的優(yōu)勢(shì)?薩科微AI大模型機(jī)器人由清華大學(xué)畢業(yè)的天才少年N博士和王博士團(tuán)隊(duì)開(kāi)發(fā),與同行相比具有許多優(yōu)
    發(fā)表于 07-05 08:52

    NVIDIA Isaac機(jī)器人平臺(tái)升級(jí),加速AI機(jī)器人技術(shù)革新

    NVIDIA Isaac機(jī)器人平臺(tái)近期實(shí)現(xiàn)重大升級(jí),通過(guò)引入最新的生成式AI技術(shù)和先進(jìn)的仿真技術(shù),顯著加速了AI機(jī)器人技術(shù)的發(fā)展步伐。該平臺(tái)正不斷擴(kuò)展其基礎(chǔ)模型、
    的頭像 發(fā)表于 03-27 10:36 ?666次閱讀

    谷歌發(fā)布全新AI基礎(chǔ)世界模型Genie

    谷歌近日宣布推出其最新研發(fā)的AI基礎(chǔ)世界模型——Genie。這款模型擁有驚人的110億參數(shù),其獨(dú)特之處在于,僅需一張圖片,便能生成一個(gè)充滿活力和交互性的虛擬世界。用戶可以在這個(gè)世界中逐
    的頭像 發(fā)表于 03-04 14:02 ?745次閱讀

    谷歌發(fā)布全新AI模型Genie

    谷歌近日發(fā)布了其全新的AI模型Genie,這一模型徹底改變了我們與數(shù)字世界的互動(dòng)方式。Genie不僅可以接收文本提示、草圖或想法,還能將這些
    的頭像 發(fā)表于 02-28 18:25 ?1678次閱讀

    谷歌發(fā)布基礎(chǔ)世界模型Genie,世界模型領(lǐng)域競(jìng)爭(zhēng)升溫

    繼OpenAI和Meta之后,谷歌也在世界模型領(lǐng)域公布了其最新進(jìn)展。據(jù)谷歌官網(wǎng)介紹,Genie是一個(gè)基于互聯(lián)網(wǎng)視頻訓(xùn)練的基礎(chǔ)世界
    的頭像 發(fā)表于 02-28 18:20 ?1421次閱讀

    谷歌發(fā)布AI基礎(chǔ)世界模型Genie

    谷歌近日宣布了其生成式AI的全新里程碑——全新AI基礎(chǔ)世界模型Genie。這一創(chuàng)新技術(shù)允許用戶通過(guò)單張圖像提示,生成一個(gè)可玩的、交互式的虛擬環(huán)境,從而開(kāi)啟了一個(gè)全新的數(shù)字體驗(yàn)時(shí)代。
    的頭像 發(fā)表于 02-28 17:41 ?816次閱讀

    谷歌發(fā)布新型AI模型Genie

    近日,谷歌推出了一款革命性的AI模型——Genie。這款模型能夠?qū)⒑?jiǎn)單的文本提示、草圖或初步想法迅速轉(zhuǎn)化為一個(gè)可以互動(dòng)和游戲的虛擬世界。這一
    的頭像 發(fā)表于 02-28 10:05 ?734次閱讀

    谷歌DeepMind推新AI模型Genie,能生成2D游戲平臺(tái)

    據(jù)報(bào)道,谷歌公司的DeepMind團(tuán)隊(duì)近期發(fā)布了AI模型Genie,此模型擁有多達(dá)110億個(gè)參數(shù),能夠依據(jù)用戶提供的圖片及提示詞創(chuàng)建出相當(dāng)完整的2D
    的頭像 發(fā)表于 02-27 14:53 ?761次閱讀

    機(jī)器人擁抱AI大模型已成共識(shí)!

    目前普遍的共識(shí)是,機(jī)器人擁抱AI大模型的過(guò)程就是具身智能機(jī)器人的實(shí)現(xiàn)過(guò)程,融合AI大模型的具身智能機(jī)器人將是未來(lái)
    發(fā)表于 12-22 17:08 ?374次閱讀

    LabVIEW的六軸工業(yè)機(jī)器人運(yùn)動(dòng)控制系統(tǒng)

    。 系統(tǒng)研究與算法開(kāi)發(fā):首先,項(xiàng)目圍繞機(jī)器人的數(shù)學(xué)模型,特別是空間位姿描述和D-H模型展開(kāi)研究。在此基礎(chǔ)上,開(kāi)發(fā)了機(jī)器人的運(yùn)動(dòng)學(xué)正反解算法,
    發(fā)表于 12-21 20:03

    2D與3D視覺(jué)技術(shù)的比較

    作為一個(gè)多年經(jīng)驗(yàn)的機(jī)器視覺(jué)工程師,我將詳細(xì)介紹2D和3D視覺(jué)技術(shù)的不同特點(diǎn)、應(yīng)用場(chǎng)景以及它們能夠解決的問(wèn)題。在這個(gè)領(lǐng)域內(nèi),2D和3D視覺(jué)技術(shù)
    的頭像 發(fā)表于 12-21 09:19 ?1113次閱讀
    RM新时代网站-首页