豆包文生圖能力升級 支持一鍵生成含指定文字圖片
2024-12-07 22:00:19AI云資訊6564
近日,字節(jié)跳動旗下智能AI助手豆包升級文生圖能力,支持一鍵生成指定文本。用戶可以在生圖提示詞中加入文本要求,如“一張帶有「新年快樂」的圖”,即可生成帶有指定文字的圖片。目前該功能已經(jīng)在豆包APP開啟測試,即夢也已小范圍測試。
(用豆包生成帶有文字的圖片)
對文生圖模型而言,如何在圖像中精準生成文本一直是難題,尤其是中文文字,經(jīng)常出現(xiàn)亂碼。據(jù)介紹,相比英文字母,漢字字符結(jié)構(gòu)更復(fù)雜,且字符數(shù)量要多兩個數(shù)量級。豆包大模型團隊相關(guān)負責人表示,豆包文生圖模型通過打通LLM和DIT構(gòu)架,具備更好的原生中文數(shù)據(jù)學習能力,并在此基礎(chǔ)上強化了漢字生成能力,大幅提升了生成效果。
據(jù)觀察,已有不少用戶嘗試使用該能力制作表情包、梗圖漫畫,或輔助生成海報,并在社交媒體平臺發(fā)布。據(jù)介紹,當前該功能僅支持文生圖時添加文字,暫不支持上傳圖片生成文字。
豆包負責人表示,該能力剛剛推出,仍在完善和優(yōu)化中。目前絕大多數(shù)情況下豆包能夠準確生成指定文字,但仍存在少部分錯字、漏字或小字亂碼等情況。“不管文字、圖片、還是音樂生成功能,豆包都希望能夠降低創(chuàng)作門檻,幫助人們更好地表達和創(chuàng)造?!睋?jù)悉,豆包網(wǎng)頁及電腦版也將在近期上線該能力。
豆包是字節(jié)跳動基于豆包大模型推出的AI智能助手,支持手機App、PC 電腦版、網(wǎng)頁版、瀏覽器插件。作為全能AI 助手,豆包能為生活、學習、工作提供幫助。用戶可以通過豆包搜索信息,答疑解惑,分析總結(jié),提供靈感,輔助創(chuàng)作,提高生活和學習效率。
相關(guān)文章
- 飛書發(fā)布知識問答等多款A(yù)I產(chǎn)品 讓企業(yè)擁有懂自己的“豆包”
- 接入豆包大模型,巨人網(wǎng)絡(luò)解鎖《太空殺》AI游戲玩法新高度
- 豆包大模型1.6發(fā)布!更強模型、更高性價比
- 字節(jié)豆包視頻模型Seedance 1.0首次登頂全球視頻生成競技榜
- 中文大模型幻覺測評:豆包大模型準確率全球第一,超越DeepSeek-R1、Gemini-2.5、GPT-4o
- Flat Ads:透視中國AI出海戰(zhàn)略,看豆包、騰訊元寶、美圖相機如何占領(lǐng)市場先機
- 涂鴉智能集成DeepSeek、豆包、OpenAI等全球先進AI大模型,發(fā)布億元補貼助力AI硬件創(chuàng)新
- “言出圖隨”:三星繪圖助手解鎖圖像創(chuàng)作的“豆包解法”
- 豆包實時語音大模型登場,誰是概念股中的 “潛力黑馬”?
- 豆包語音大模型首家引領(lǐng)級通過中國信通院語音大模型評估
- AI PC獲“豆包”助攻 新硬件催生新價值
- 智源最新評測結(jié)果發(fā)布:豆包大模型“主觀評測”排名第一,多榜單位居國內(nèi)第一
- 基于豆包·視頻生成模型打造創(chuàng)新體驗,即夢成為“想象力的相機”
- 豆包文生圖能力升級 支持一鍵生成含指定文字圖片
- 火山引擎正式發(fā)布豆包.語音模型創(chuàng)業(yè)者加速計劃
- 融入字節(jié)豆包AI,“I系搭子” FIIL首款實用型 AI耳機GS Links即將上市
人工智能企業(yè)
更多>>人工智能硬件
更多>>- 從心出發(fā),新品與新技術(shù)雙重進化,技嘉2025線下產(chǎn)品發(fā)布會強勢來襲
- 當“銀發(fā)”遇見“智眼”——神眸亮相2025深圳智慧養(yǎng)老展
- 訊飛同傳助力亞布力夏季年會,打破語言壁壘促全球?qū)υ?/a>
- 低空賦能,跨越山河,大疆運載無人機的甘孜答卷
- 預(yù)制菜又吵起來了?優(yōu)特智廚炒菜機新品發(fā)布會掀起中餐“現(xiàn)炒”熱潮
- 場景化落地部署人形機器人將超2000臺,眾擎機器人與多倫科技達成戰(zhàn)略合作
- 275W極限性能+第二代乾坤散熱!拯救者R9000P 2025至尊版成就電競創(chuàng)作雙巔峰
- 百年聲學品牌再創(chuàng)新!拜雅新品AMIRON 200 & AMIRON ZERO定義開放聆聽新方式
人工智能產(chǎn)業(yè)
更多>>- 人機共生 · 智啟未來——2025高交會亞洲人工智能與機器人產(chǎn)業(yè)鏈展主題發(fā)布
- 北京數(shù)基建發(fā)布“知行IntAct”混合智能體產(chǎn)品,以AI定義城市治理新范式
- 新時達“精耕小腦”,與大腦協(xié)同,加速具身智能垂直落地
- 亞洲愿景論壇 東軟蓋龍佳談AI與數(shù)據(jù)價值化重構(gòu)醫(yī)療未來
- 破解AI落地難題!北大這場特訓(xùn)營,為企業(yè)找到轉(zhuǎn)型“最優(yōu)解”
- 腦神經(jīng)成像提速數(shù)倍、AI練就“遺忘術(shù)”!2025螞蟻InTech獎頒發(fā)
- 一句話生成圖表!天禧智能體接入ChatExcel MCP Server讓數(shù)據(jù)處理變得如此簡單
- 外灘大會重磅發(fā)布:螞蟻百寶箱Tbox超級智能體亮相,實現(xiàn)分鐘級專業(yè)軟件交付
人工智能技術(shù)
更多>>- 外灘大會首發(fā)! 螞蟻密算推出AI密態(tài)升級卡 實現(xiàn)零改動“即插即用”
- 騰訊優(yōu)圖攜Youtu-Agent開源項目亮相上海創(chuàng)智學院首屆TechFest大會
- 2025外灘大會:王堅暢談AI變革,普天科技錨定空天算力新賽道
- 騰訊正式開源Youtu-GraphRAG,圖檢索增強技術(shù)迎來落地新突破
- 聲網(wǎng)兄弟公司 Agora與OpenAI 攜手 助力多模態(tài) AI 智能體實現(xiàn)實時交互
- Qwen-Image-Edit 模型上線基石智算,圖像編輯更精準
- 火山引擎多模態(tài)數(shù)據(jù)湖落地深勢科技,提升科研數(shù)據(jù)處理效能
- 斑馬AI大模型:為每個孩子提供專屬學習方案