專利解密度曉曉作答高考語文議論文背后的秘密百度智能輔助寫作方案
【嘉勤點(diǎn)評(píng)】百度發(fā)明的基于人工智能的輔助寫作方案,能夠基于人工智能對(duì)寫作原文進(jìn)行處理,從而得到寫作輔助信息,并將相應(yīng)的寫作輔助信息展示給用戶,從而提高輔助用戶寫作的效果。
集微網(wǎng)消息,全民關(guān)注的2023年高考如約而至。在這次高考中,百度推出的數(shù)字人度曉曉作答了全國新高考卷題為《本手、妙手、俗手》的議論文,曾擔(dān)任北京高考語文閱卷組組長的申怡認(rèn)為,該作文緊扣主題、立意明確,結(jié)構(gòu)完整且語言流暢。
度曉曉的“寫作能力”正是建立在人工智能的基礎(chǔ)上實(shí)現(xiàn)的,人工智能是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。其是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器。
現(xiàn)實(shí)生活中,許多人在寫作的時(shí)候經(jīng)常因?yàn)樽约旱奈牟刹患讯械綗?,很多時(shí)候想不出合適的詞語和句子,寫出來的文章干癟蒼白,或者是因?yàn)樽约旱拈喿x儲(chǔ)備太少,沒有寫作靈感。這個(gè)時(shí)候就需要一個(gè)智能工具來幫助寫作者。
為此,百度早在2023年10月28日就申請(qǐng)了一項(xiàng)名為“基于人工智能的輔助寫作方法和裝置”的發(fā)明專利(申請(qǐng)?zhí)枺?02310972240.7),申請(qǐng)人為北京百度網(wǎng)訊科技有限公司。
根據(jù)該專利目前公開的相關(guān)資料,讓我們一起來看看這項(xiàng)技術(shù)方案吧。
如上圖,為該專利中發(fā)明的基于人工智能的輔助寫作方法的流程示意圖,首先,獲取用戶輸入的寫作原文。接著,基于人工智能對(duì)寫作原文進(jìn)行處理,得到寫作輔助信息,該過程中主要利用人工智能中的自然語言處理技術(shù)進(jìn)行相應(yīng)的處理。隨后,系統(tǒng)再將寫作輔助信息展示給用戶。
如上圖,為該專利中示意的詞語替換推薦功能和詞語聯(lián)想功能的展示界面示意圖,上圖中的上方文本是用戶輸入的寫作原文21,在用戶輸入寫作原文后,給出如下方的左側(cè)所示的詞語替換部分22,該方案中的裝置會(huì)自動(dòng)識(shí)別寫作原文中可被替換的詞語(并且可以用預(yù)設(shè)標(biāo)記進(jìn)行標(biāo)識(shí)),再基于人工智能給出可被替換的詞語的推薦詞語。
每個(gè)可被替換的詞語的推薦詞語可以在鼠標(biāo)光標(biāo)懸浮在可被替換的詞語上時(shí)展示相應(yīng)的推薦詞語。在將推薦詞語展示給用戶時(shí),用戶可以點(diǎn)擊需要的推薦詞語后,用點(diǎn)擊的推薦詞語替換相應(yīng)的可被替換的詞語。這樣用戶就不會(huì)因?yàn)檎也坏綔?zhǔn)確的用詞而發(fā)愁了。
在進(jìn)行具體的實(shí)現(xiàn)過程中,會(huì)首先對(duì)原文進(jìn)行切詞,以得到組成寫作原文的分詞。對(duì)應(yīng)各個(gè)分詞,基于人工智能識(shí)別相應(yīng)的分詞是否為可被替換的詞語,并在分詞為可被替換的詞語時(shí),確定分詞的詞語替換推薦信息。
其中,會(huì)根據(jù)每個(gè)替換詞對(duì)應(yīng)的語言模型得分、文采得分、用戶的點(diǎn)選信息,得到每個(gè)替換詞的綜合得分。如果存在綜合得分大于預(yù)設(shè)得分的替換詞,則確定該分詞是可被替換的詞語,并將綜合得分大于預(yù)設(shè)得分的替換詞按照綜合得分進(jìn)行排序,在排序后的替換詞中按序選擇預(yù)設(shè)個(gè)數(shù)的替換詞作為該分詞的詞語替換推薦信息。
此外,該系統(tǒng)還具有詞匯聯(lián)想、靈感激發(fā)、智能素材推薦、智能基礎(chǔ)改寫以及智能潤色改寫功能。
如上圖,為該系統(tǒng)進(jìn)行智能素材推薦功能的展示界面示意圖,對(duì)應(yīng)寫作原文,系統(tǒng)給出了智能素材推薦部分。在該過程中,系統(tǒng)會(huì)深度分析和理解用戶提供的寫作原文,為用戶推薦相關(guān)主題的寫作素材(如新聞、歷史故事等),用戶也可以自己選擇想要的素材類型,比如新聞、歷史故事等,此功能在議論文寫作中非常實(shí)用。
在該功能的實(shí)現(xiàn)過程中,首先會(huì)從公開的網(wǎng)頁數(shù)據(jù)中抓取優(yōu)質(zhì)的新聞、人文歷史故事等候選素材,然后用摘要技術(shù)和文檔標(biāo)簽技術(shù)分別對(duì)抓取的語料進(jìn)行處理,生成相應(yīng)摘要和文檔標(biāo)簽。通過抽取出用戶輸入文本中的主題詞,然后與語料的標(biāo)簽進(jìn)行比對(duì),召回一批候選的相近主題的素材。再使用主題模型計(jì)算用戶輸入與摘要的相似度,對(duì)候選的素材進(jìn)行排序,將相似較高的呈現(xiàn)的素材的摘要呈現(xiàn)給用戶。
最后,如上圖,為該系統(tǒng)進(jìn)行智能潤色改寫功能的展示界面示意圖,該功能主要可以分解為三個(gè)部分:詞語的替換,句子的改寫以及增加詞語或短句。詞語的替換沿用詞語替換推薦功能的技術(shù)方案,使用最優(yōu)的替換結(jié)果。
句子的改寫有兩種方案,方案一是人工配置一些潤色的規(guī)則,方案二是人工標(biāo)注一些潤色的訓(xùn)練語料,用RNN或者LSTM神經(jīng)網(wǎng)絡(luò)來進(jìn)行學(xué)習(xí)。增加詞或短句功能可以通過一定的模板挖掘從大數(shù)據(jù)語料中挖掘出實(shí)體或者主題對(duì)應(yīng)的描寫詞和描寫短句,并同時(shí)記錄下短句周圍的關(guān)鍵詞。每次對(duì)輸入文本的句子作解析,用CRF模型或者句法分析規(guī)則找出句子的核心主體詞,然后根據(jù)周圍關(guān)鍵詞的匹配,添加合適的描寫詞或描寫短句。
以上就是百度發(fā)明的基于人工智能的輔助寫作方案,該方案能夠基于人工智能對(duì)寫作原文進(jìn)行處理,從而得到寫作輔助信息,并將相應(yīng)的寫作輔助信息展示給用戶,從而提高輔助用戶寫作的效果。
關(guān)于嘉勤
深圳市嘉勤知識(shí)產(chǎn)權(quán)代理有限公司由曾在華為等世界500強(qiáng)企業(yè)工作多年的知識(shí)產(chǎn)權(quán)專家、律師、專利代理人組成,熟悉中歐美知識(shí)產(chǎn)權(quán)法律理論和實(shí)務(wù),在全球知識(shí)產(chǎn)權(quán)申請(qǐng)、布局、訴訟、許可談判、交易、運(yùn)營、標(biāo)準(zhǔn)專利協(xié)同創(chuàng)造、專利池建設(shè)、展會(huì)知識(shí)產(chǎn)權(quán)、跨境電商知識(shí)產(chǎn)權(quán)、知識(shí)產(chǎn)權(quán)海關(guān)保護(hù)等方面擁有豐富的經(jīng)驗(yàn)。
(校對(duì)/趙月)