欧美丰满大黑帍在线播放,JAPAN丰满人妻HD,无码人妻巨大屁股系列,男女激情边摸边做边吃

出版人站上大模型風口

發(fā)布日期:2023-12-25 作者:聶慧超 內容來源:中國出版?zhèn)髅缴虉?/div>

2023年科技領域的年度熱詞,“大模型”榜上有名。隨著OpenAI的出現,大模型生態(tài)初現。當基礎大模型日漸成熟之后,針對一些具體行業(yè)和應用場景的垂直大模型的訓練會越來越普遍,屆時,這些行業(yè)中掌握著大量垂直語料的機構也必然更有優(yōu)勢。

出版業(yè)作為知識生產者,掌握著龐大的語料庫,能為大模型提供源源不斷的養(yǎng)分,這也是出版人覺得在大模型可以一試的原因。經歷了初期觀望與“試練”后,對于生成式AI這一新技術“又愛又怕”的出版人也踏上這條賽道,將想法逐步落實到行動上,期望帶來存量的效率提升與增量的新應用場景。

日前,德國媒體巨頭阿克塞爾·施普林格(Axel Springer)與美國人工智能研究公司OpenAI建立戰(zhàn)略合作關系,OpenAI將付費使用施普林格旗下出版物的內容。施普林格也因此成為全球范圍內首家與OpenAI合作的出版商。

在國內,中原出版?zhèn)髅郊瘓F下屬大象出版社,由于今年6月與施普林格·自然集團簽訂“中國漢學研究史論叢書”中英文同步出版協(xié)議,而被稱為“國內首家與OpenAI達成間接合作的出版社”。

事實上,國內出版人對大模型的關注,最開始是落地到相關圖書內容中。從2023年年初開始,關于ChatGPT類大語言模型的各類書籍上架,例如,中譯出版社的《大模型時代:ChatGPT開啟通用人工智能浪潮》、華齡出版社的《ChatGPT:AI革命》、中信出版社的《生成式人工智能:一本書帶你讀透AIGC》等等。國外亦是如此。據了解,亞馬遜專門開辟了ChatGPT類大語言模型的書籍專欄。截至2023年10月13日,在亞馬遜官網以“高級檢索”方式,檢索署名作者為“ChatGPT”的書籍,已有1024種,以“AI”為作者的書籍則更多。

為了加快與新技術融合的步伐,不少出版文化機構選擇“跳出書頁”,躬身入局大模型。文心一言是百度基于文心大模型技術推出的生成式對話產品。今年以來,人民交通出版社、上海辭書出版社、四川人民出版社、重慶出版集團·天下圖書、國家圖書館、中文在線等出版文化機構紛紛宣布接入百度文心一言。這場對話式語言模型技術在國內出版市場的初步著陸,讓出版人感到興奮之余,也紛紛開始嘗試在產品研發(fā)、標準制定等多個領域展開深化合作,試圖借助這一技術打造“出版+人工智能全系產品/服務”,形成出版機構獨有的數字經濟時代的“新質生產力”。一時間,大模型給出版概念股帶來的股價高漲,讓人們對這一領域寄予了更多期待。

隨著大模型越來越“聰明”,國內外出版企業(yè)及相關科技公司為了率先吃到大模型應用帶來的市場紅利,開始投入更多力量。北京師范大學新聞傳播學院媒介融合與數字出版中心主任、國家新聞出版署出版業(yè)用戶行為大數據分析與應用重點實驗室主任秦艷華及其團隊研究發(fā)現,據不完全統(tǒng)計,截至2023年11月6日,我國共有188個單位研發(fā)出201個大語言模型。

值得注意的是,走過開始的混沌期,大模型競技場當前越來越呈現出兩條清晰的路線:一是以云服務廠商為代表的巨頭們逐鹿的基礎通用大模型賽道;二是在基礎通用大模型之上,深耕千行百業(yè)多年的“資深行家”搶灘構建的垂直行業(yè)大模型。

秦艷華基于對人工智能和大模型應用領域的深入研究與觀察發(fā)現,大語言模型產業(yè)生態(tài)當前已經在文本、音頻、視頻等多模態(tài)交互功能上持續(xù)演化升級,奠定了多場景的商用基礎。多款大語言模型具備了跨模態(tài)、跨語言的深度語義理解與生成能力,為出版業(yè)提供了更多開發(fā)應用的可能性。目前國內出版業(yè)對人工智能大語言模型的應用持慎重而樂觀的態(tài)度。

雖然還未將大語言模型完全應用于圖書出版全流程,但在圖書出版的部分環(huán)節(jié),比如編輯校對、翻譯、有聲制作、圖書推薦(視頻)等,已有大語言模型應用的探索和實踐。

日前,中華書局古聯(lián)公司聯(lián)合南京農業(yè)大學信息管理學院推出“荀子”古籍大語言模型。中國圖書進出口(集團)有限公司旗下的中圖科信數智技術(北京)有限公司,研發(fā)了針對農業(yè)、水利、出版知識服務等四大領域研發(fā)中圖科信垂類大模型。城市傳媒目前已初步完成服務出版行業(yè)的專業(yè)大模型“萬象”測試版開發(fā),并與科大訊飛達成協(xié)議,共建“AI出版?zhèn)鞑?chuàng)新研究院”。中信出版集團今年5月成立了平行出版實驗室,將技術和編輯人員整合于此,從AI介入方面進行研發(fā),包括校對、編審、圖片以及視頻生成等工作;并嘗試與作者和大模型公司合作語言訓練,開發(fā)智能閱讀應用產品,例如,公司旗下的知識服務平臺與百度聯(lián)合發(fā)布了“中信書院AI閱讀助手”插件。果麥文化傳媒股份有限公司攜手愛漫閣(上海)智能科技有限公司,發(fā)布了國內首款專業(yè)動漫圖文模型與AI工具1.0版本,基于算法的優(yōu)化和創(chuàng)新,解決了生成圖片隨機、位置不固定等問題。中華醫(yī)學會雜志社與科大訊飛基于星火認知大模型開展了輔助寫作和智能問答的合作,未來還將協(xié)力開展更廣泛的個性化的醫(yī)學知識服務。此外,中華醫(yī)學會雜志社在稿件的采編評審環(huán)節(jié)引入了AI寫作檢測工具,做好AI代寫的事前預警,防止新型學術不端行為的發(fā)生。蜜度發(fā)布了國內首個智能校對領域大模型“蜜度文修”,大幅提升中文校對和潤色能力的智能化程度。中文在線的“中文逍遙”大模型目前已用于短劇劇本創(chuàng)作,未來將延伸到產出高質量的對話和劇本,為影視創(chuàng)作者提供創(chuàng)意靈感和創(chuàng)作輔助。浙江大學、高等教育出版社、阿里云、華院計算等單位共同研制的“智海-三樂”教育大模型,集成了搜索引擎、計算引擎和本地知識庫等功能,可提供智能問答、試題生成、學習導航、教學評估等能力。中國知網發(fā)布出版?zhèn)髅叫袠I(yè)大模型和文化遺產大模型兩款AI大模型,同期,在線發(fā)布AIGC檢測服務系統(tǒng),專為出版?zhèn)髅叫袠I(yè)提供AI選題策劃、AI增強檢索各類AI工具,并融入到出版業(yè)務流程,賦能出版?zhèn)髅叫袠I(yè)全流程數智化轉型。

在大模型的內容生產中,如何確保內容的版權得到妥善保護?這是AI大模型在內容生成中一個不容忽視的問題,也是一個亟待解決的問題。為了更好地記錄AI生成內容的創(chuàng)作過程和版權信息,確保內容的真實性和版權歸屬的明確性,龍源數字傳媒集團近日基于大模型AI和版權文章庫研發(fā)了知識發(fā)現與創(chuàng)作平臺“文可知識文庫”,為AI生成的內容提供版權確權服務。12月20日,中國音像與數字出版協(xié)會發(fā)布《出版業(yè)生成式人工智能技術應用指南》團體標準,該文件規(guī)定了出版業(yè)應用生成式人工智能技術的基本原則、主要應用場景和相應的保障措施,自2024年1月20日起開始實施。新標準的出臺,為出版機構應用生成式人工智能技術提供了重要指導,這也意味著,出版人在新技術探索的下一環(huán)節(jié)中,從政策變化、監(jiān)管深化,再到產業(yè)轉型、動能轉換,組織管理將持續(xù)迎來更深入的變革與思考。

各種垂類大模型層出不窮,但一系列核心難點的存在,一定程度上將會影響這場探索的前行速度。秦艷華坦言:“針對出版業(yè)應用的、具有代表性大語言模型大多較為散亂,且處于起步階段。出版業(yè)大模型研發(fā)多基于自己的私域數據,希冀開發(fā)出某些用于出版某環(huán)節(jié)的大語言模型。而這些出版企業(yè)自己私有語料、數據,其實在訓練大模型方面遠遠不夠。行業(yè)模型的建立除了需要人工智能領域高科技人才、高資金投入、高算力之外,還需要有價值的語料訓練。高質量的語料問題是解決出版業(yè)行業(yè)大模型的關鍵。”

針對這些問題,秦艷華建議,出版企業(yè)要轉換思維模式,要有互聯(lián)網精神,開放、平等、協(xié)作、快速、共享,與高??蒲袡C構、高科技公司等展開深度合作,在語料資源、數據資源、科技資源等方面實現共享,同時尋找恰當的利益分配模式,多方共贏。在大語言模型生成文本的基礎上,跨模態(tài)生成技術有望進一步幫助出版方迅速打造以紙質圖書為主、融合一種乃至多種媒體形式和技術形成的融媒圖書,增強圖書的趣味性和讀者沉浸感,真正實現出版的深度數字化轉型。

面對這場巨變,出版人只有積極變更思維、勇于轉換賽道,嘗試在品牌資源建設全流程下功夫、注重規(guī)避潛在風險,并鞏固好選題策劃、內容創(chuàng)造、知識服務等看家本領,才能不被時代所淘汰。

責任編輯:LAL
?更多新聞
 
 
Copyright 2020-2020 中版集團數字傳媒有限公司 京ICP備12006732號-18