9月9日,字節(jié)跳動(dòng)Seed團(tuán)隊(duì)宣布推出豆包圖像創(chuàng)作模型Seedream 4.0。該模型支持文生圖、圖像編輯及多圖參考等功能,多模態(tài)生圖效果、速度和可用性在專業(yè)評(píng)測(cè)中達(dá)到業(yè)界領(lǐng)先水平。
目前,Seedream 4.0已在豆包App、即夢(mèng)AI、扣子等產(chǎn)品正式上線,用戶可以免費(fèi)體驗(yàn)。該模型也已通過(guò)火山引擎開(kāi)放給企業(yè)客戶。
Seed團(tuán)隊(duì)表示,“Seedream 4.0不僅僅是一個(gè)圖像生成模型,更是一個(gè)具備知識(shí)和思考能力的多模態(tài)創(chuàng)意引擎。”
測(cè)試案例顯示,Seedream 4.0不僅能理解物理規(guī)律與時(shí)間約束、三維空間等復(fù)雜語(yǔ)境,還能在解謎、填字、續(xù)寫漫畫等任務(wù)中保持風(fēng)格一致與細(xì)節(jié)精致,邏輯推理和創(chuàng)意生成能力表現(xiàn)出色。
Seedream 4.0 測(cè)試效果(提示詞:六個(gè)小時(shí)后這個(gè)圖片的場(chǎng)景是什么樣子)
據(jù)介紹,Seedream 4.0可靈活支持文本、圖像的組合輸入,抽取不同圖片元素進(jìn)行創(chuàng)作,還可一次生成角色連貫、風(fēng)格統(tǒng)一的組圖,實(shí)現(xiàn)表情包、連環(huán)畫等各類創(chuàng)意玩法。
同時(shí),該模型支持高度自由的藝術(shù)風(fēng)格遷移,最高可生成4K分辨率的商用級(jí)圖像,并具備出色的文字渲染能力,還可處理基礎(chǔ)的公式、表格、統(tǒng)計(jì)圖等復(fù)雜排版,廣泛適用于教育、電商、廣告設(shè)計(jì)、影視后期等應(yīng)用場(chǎng)景。
基于高效的模型架構(gòu)和多層推理加速,Seedream 4.0實(shí)現(xiàn)了高質(zhì)量和高效生成的平衡。Seed官網(wǎng)顯示,Seedream 4.0在各維度專業(yè)評(píng)測(cè)的綜合表現(xiàn)排名業(yè)界前列,視覺(jué)美感、速度等關(guān)鍵指標(biāo)成績(jī)突出,并展現(xiàn)出較強(qiáng)的可靠性。
Seed團(tuán)隊(duì)表示,圖像創(chuàng)作正在從文生圖進(jìn)入多模態(tài)交互的新階段,Seedream 4.0已具備通用多模態(tài)創(chuàng)意引擎的雛形。團(tuán)隊(duì)將繼續(xù)探索更實(shí)時(shí)的交互式生成體驗(yàn),進(jìn)一步深度融合多模態(tài)推理與世界知識(shí),更好地幫助用戶激發(fā)靈感、實(shí)現(xiàn)創(chuàng)意。