資訊
  • 視頻
  • 焦點
  • 娛樂
  • 文化
  • 財經
  • 首頁 > 教育 > 考試信息 > 正文

    高中研究報告格式范文模板—高中研究性報告怎么寫

    一、大模型發展的前世今生

    1、AI 大模型的進化簡史:從神經網絡到預訓練大模型

    自 1956 年,“人工智能”概念提出開始,已經有了近 70 年的發展歷史,經歷了三個發展階段,即萌芽期(1950-2005),探索期(2006-2019),發展期(2020 年以后),不過真正大模型的歷史還要從 2006 年 Deep Learning 首次在 Science 上發表開始,不過在 2012 年之前,大模型的探索與學習的關注度并不是很高。

    2012 年,AlexNet 戰勝 ImageNet 這一標志性事件,引發了行業對深度學習的關注和研究,而谷歌、百度等行業先行者也是在這一時期開始重視 AI 的發展。2013 年 Google Brain 項目發布了深度學習模型 DistBelief,為大規模分布式訓練奠定基礎。2014 年,被譽為 21 世紀最強大算法模型之一的 GAN(對抗式生成網絡)誕生,標志著深度學習進入了生成模型研究的新階段。2017 年, Google 又提出了 Transformer,這成為 GPT 發展的基礎。

    說起 Transformer,那就不得不提那篇傳奇論文《Attention Is All You Need》,這篇論文不僅僅成為大模型研究的必讀參考文獻,該論文的 8 位作者也成為大模型創投圈炙手可熱的人物,據悉,該論文的 8 位作者,僅有一位留在了谷歌,剩下的 7 位紛紛加入了創業大軍,他們創立的 4 家公司中,有 3 家成為獨角獸,其中包括 Adept、Character.AI、Cohere,而在這些獨角獸背后站著的是谷歌、英偉達、Salesforce 等行業先行者。

    不過讓人意外的是,作為行業先行者,谷歌并沒有率先發布令市場轟動的產品,反而是一家 2015 年 12 月成立的創業公司,引領了接下來大模型的發展,這家公司便是 OpenAI。

    2018 年 OpenAI 發布 GPT-1 模型,標志著預訓練模型在自然語言處理領域的興起。2019 年,OpenAI 和 Google 又分別發布了 GPT-2 與 BERT 大模型,意味著預訓練大模型成為自然語言處理領域的主流。

    2020 年,大模型進入快速發展階段,當年 OpenAI 推出了 GPT-3,模型參數規模達到了 1750 億,成為當時最大的語言模型,并且在零樣本學習任務上實現了巨大性能提升。隨后,更多策略如基于人類反饋的強化學習(RHLF)、代碼預訓練、指令微調等開始出現,被用于進一步提高推理能力和任務泛化。

    2022 年 11 月,OpenAI 推出了搭載 GPT3.5 的 ChatGPT,其逼真的自然語言交互與多場景內容生成能力,迅速火爆全網,2023 年上半年的 AI 熱潮也就此展開。

    2023 年,OpenAI 發布超大規模多模態預訓練大模型 GPT-4,具備了多模態理解與多類型內容生成能力。谷歌推出 PaLM2 模型,Meta 發布 LLaMA-13B,微軟基于 ChatGPT 打造 New Bing Windows 全面集成 Copilot。

    國內,百度率先發布文心一言,隨后阿里、商湯、360、華為等企業紛紛發布自己的大模型,復旦、清華、哈工大、中科院等學院派,也發布了各自的大模型,中小非上市公司印象筆記、醫聯科技、左手醫生等也推出了行業大模型,市場進入了“百模混戰”格局。

    2、5 年后全球大模型市場規模破千億美元,國內破千億元人民幣

    大模型作為通用性技術,在自然語言處理、計算機視覺、語音識別、文本識別、推薦系統等多個領域均能展現其突出的作用,如何判斷其市場規模在學術上仍有較多的爭論,不同機構根據統計方法的不同,所得出的結論也有所出入。

    其中,根據大模型之家的測算,預計到 2023 年,全球大模型市場規模將達到 210 億美元,到 2028 年,其規模將達到 1095 億美元。

    高中研究報告格式范文模板—高中研究性報告怎么寫

    根據國際數據公司 IDC 預測,全球 AI 計算市場規模將從 2022 年的 195.0 億美元增長到 2026 年的 346.6 億美元。其中,生成式 AI 計算市場規模將從 2022 年的 8.2 億美元增長到 2026 年的 109.9 億美元。

    而中國龐大的市場需求和豐富的人才儲備,為大模型的發展壯大提供了有利的客觀條件,大數據之家預測,中國大模型產業市場規模將達到 147 億元人民幣,并在 2028 年達到 1179 億元。

    而 IDC 對基于大模型的 AI 市場規模進行了預測,預計中國人工智能市場規模在 2023 年將超過 147 億美元,到 2026 年這一規模將超過 264 億美元。

    3、小結

    通過對 AI 大模型發展史的梳理可以發現 AI 的基礎研究發源并發展于美國,在基礎大模型方面美國具有開創性作用,而國內大模型廠商更多扮演者追隨者的角色,不過國內人工智能市場規模大,增長速度快,這又對人工智能的發展集聚數據燃料,提出新的落地需求,中國人工智能或在這樣的環境下,率先在場景落地上趕超美國。

    二、大模型進入“百模混戰”時代

    1、全球已發布大模型超 200 個,中美數量占全球的九成

    雖然 ChatGPT 點燃了大模型發布的熱情,不過早在 ChatGPT 發布之前,全球已經發布了不少大模型,《中國人工智能大模型地圖研究報告》顯示,2019 年 美國已經有了 4 個大模型,而中國 2020 年有了 2 個大模型,此后每年都有大模型發布,僅僅 2023 年的前五個月,中美分別有 19、18 個大模型發布。

    截至 2023 年 5 月底,國內 10 億級參數規模以上基礎大模型至少已發布 79 個,而美國這一數字為 100 個,全球累計發布大模型 202 個,中美兩國大模型的數量占全球大模型數量的近 90%,中國大模型數量已進入第一梯隊。

    發布大模型的機構可以分為四種類型,互聯網公司、學術/研究機構、AI 公司及行業公司。

    國內大模型呈快速發展之勢,在以下幾個方面表現突出:

    一是,大模型應用越來越廣泛,在自然語言處理、圖像識別、語音識別、內容生成等多個領域有著廣泛應用。

    二是,大模型算法豐富,國內的模型上除了 GPT 之外,還對 BERT、ALBERT、NEZHA 等進行了廣泛的探索。

    三是,大模型性能不斷提升,國內大模型玩家紛紛加大對 AI 的研發投入。據鈦媒體·鈦度圖聞不完全統計 2022 年,華為在研發費用上投入 1615 億元,成為研發投資資金最多的企業;其次,騰訊以 614 億元排名第二,阿里以 555 億元排名第三,他們在硬件和軟件領域的大規模投入,大大提高了大模型的運算速度和效率。

    四是,大模型研究成果不斷涌現,國內以清華、復旦、哈工大等高校也推出了自己的大模型,國內機構在 NLP、CV 等領域也拿到了多個國際級別的冠軍。

    然而不得不承認的是,國內大模型迅猛發展的同時也面臨著基礎模型研發能力不足,部分行業數據搜集整理難度大等問題。

    據國外風投數據公司 PitchBook 的數據,2023 上半年,全球人工智能領域共計發生融資 1387 件,籌集融資金額 255 億美元,平均融資金額達 2605 萬美元。

    根據 Crunchbase 數據庫 2011-2023 年共計 3658 個 AI 領域融資項目(僅統計 500 萬以上融資金額的項目,且融資公司所在地為美國),美國 AI 領域融資項目數及融資金額穩步增長。2022 年美國風投 AI 領域融資項目數為 574 個,2011-2022 年 CAGR 達 29.3%;2022 年美國 AI 領域融資金額為 243.5 億美元,2011-2022 年 CAGR 達 422.5%。

    據業界不完全統計,2023 年上半年,美國 AIGC 一級市場中,硅谷在人工智能領域共完成了 42 起融資,總金額約 140 億美元,占世界總融資金額的 55%。平均輪次融資金額為 3.3 億美元,是平均融資水平的近 13 倍之多。其中,8 家人工智能明星獨角獸公司拔地而起,平均輪次融資金額 3.3 億美元。

    據國內商業信息服務平臺企名片數據顯示 2023 上半年,國內人工智能領域共發生 161 起投融資事件,其中包括人工智能核心技術 44 起,人工智能基礎 支撐 43 起,人工智能應用場景 40 起,人工智能通用場景 34 起。較去年同期減少 153 起,同比下降 49%; 2023 上半年度國內人工智能領域投融資交易事件涉及總金額 61.74 億元,較去年同期減少 99 億元,同比下降 62%。

    據欽媒體數據,2023 年上半年,國內披露獲得投資的大模型公司只有大約 20 家,融資額普遍在千萬到數億元之間。其中,獲得融資金額最多的是大模型初創公司 MiniMax,其在 6 月 1 日完成了超 2.5 億美元的新一輪融資,目前該公司估值超 12 億美元,被冠以“騰訊首次投資的創企”稱號。此外,成立于 2021年的西湖心辰分別在 2023 年 3 月、 4 月接連完成了兩筆融資,融資速度很快。

    據鈦媒體不完全統計,騰訊投資、創新工場、奇績創壇、紅杉中國是較活躍的投資機構,投資企業均達到 3 家,其次是 BV 百度風投和智譜 AI,投資企業分別為 2 家,大多數機構投資的企業僅為 1 家,而一向活躍的高瓴創投、深創投沒有公開數據顯示其進行過 AI 大模型賽道的投資 IDG 資本、經緯創投、真格基金等頭部 VC 的出手也較少。

    這主要是因為,大模型創業是極其燒錢的,據估算,大模型訓練一次的成本介于 200 萬美元-1200 萬美元之間。即便是有馬斯克和微軟支持的 OpenAI 也要不斷融資來維持,僅 2022 年,其就虧損了 5.4 億美元左右。

    所以,國內的通用大模型玩家主要還是百度、阿里、騰訊、華為等大型企業,而創業公司更多是尋找可落地的場景來實現變現。

    3、“龍頭大模型+”是當前大模型發展主要模式

    雖然大模型發布數量不斷增長,然而對于大模型如何落地變現,仍在不斷探索中,據中國電信研究院分析,國外行業大模型發展模式主要有三種,且以前兩種發展模式為主。

    一是目前國際巨頭多采用這種模式,如谷歌、微軟、Meta 等龍頭廠商利用大模型重構原有業務,比如微軟利用 GPT-4 全面“龍頭大模型+原有業務”賦能 A zure 云、Office365、Dynamics365 等傳統業務。這種模式的優勢在于可以利用大模型的強大語言能力,提升原有業務的智能化水平,同時也可以借助原有智車業務的數據和用戶資源,增強大模型的應用相關性和準確性。

    二是“龍頭大模型+外部行業數據”。這種模式是國內創業公司普遍采用的方式,通過直接調用 API 或基于 GPT 大模型微調改進自身 AI 產品,比如哈維基于 GPT 及行業數據推出“AI 法律助手”。這種模式的優勢在于可以利用龍頭大模型的先進技術和算力,快速打造出具有行業特色和競爭力的 AI 產品,同時也可以借助外部數據源,增強行業相關性和準確性。

    三是“開源大模型+ 自有行業數據搭建行業大模型”。這種模式多適用于有著豐富的行業數據積累的中大型企業。例如基于開源模型研發,實現 LLM 與金融垂直領域知識的深度融合。這種模式的優勢在于可以充分利用自有數據的質量和數量級,打造出更專業、更精準的行業大模型,同時也可以借鑒開源大模型的技術和經驗,提升訓練效率和效果。

    總體而言,基礎大模型訓練成本高,研發難度大,這決定了大模型會遵照“贏者通吃”的規律,未來市場上僅存幾個龍頭大模型,而圍繞龍頭大模型的創業生態將逐步形成。

    在商業模式上,根據天風證券研報,目前大模型主要的盈利模式包括交易量收費、 定制開發費用、服務費用和訂閱收費。

    交易量收費主要是根據客戶每月使用的 API 調用或交易量收取費用。定價標準通常是按交易量計算,例如每千個 API 調用收取一定的費用。

    定制開發費用是,如果客戶需要特定領域的 AI 模型,公司通常會收取定制開發費用。定價標準通常取決于開發的難度和時間成本。

    服務費用指,根據提供數據處理、標注和質量控制服務等來收取費用。

    訂閱費用是指,客戶可以根據需要選擇不同的訂閱級別,如基本、標準或高級。訂閱費用通常按月或按年收取,并根據所需服務的數量和類型進行定價。

    4、國內外代表性大模型介紹

    1)OpenAI:大模型熱度引爆者 GPT 系列模型引領者

    2015 年 12 月 OpenAI 由馬斯克、美國創業孵化器 Y Combinator 總裁阿爾特曼、全球在線支付平臺 PayPal 聯合創始人彼得·蒂爾等硅谷科技大亨創立。2023 年 4 月,OpenAI 完成 3 億美元最新一輪融資,累計完成 103 億美元融資,最新估值達 270 億 -290 億美元。

    OpenAI 是基于 Transformer 基礎模型推出了 GPT 系列大模型。GPT(Generative Pre-trained Transformer) 即生成式預訓練 Transformer 模型,模型被設計為對輸入的單詞進行理解和響應并生成新單詞,能夠生產連貫的文本段落。

    2019 年、2020 年,OpenAI 分別發布了 GPT-2 和 GPT-3,但并未在市場上引起轟動。2022 年 11 月,OpenAI 發布 ChatGPT。ChatGPT 基于 GPT 技術,通過大量的語料訓練,可以模擬人類的對話方式和思維方式,從而實現了與人類的交互。相比傳統的聊天機器人,ChatGPT 在語言理解和回答問題方面更加準確和自然,更加符合人類的交流習慣。ChatGPT 的操作非常簡單,用戶只需輸入自己想要說的話 ChatGPT 就會立刻回答,回答內容也十分豐富,包括天氣、新聞、娛樂等,隨著用戶的探索,ChatGPT 在辦公、寫論文等多個領域有著良好的體驗,這些優點讓 ChatGPT 迅速引爆市場,開啟了 2023 年的人工智能熱潮。

    2023 年 3 月,OpenAI 又推出了 GPT-4,這是其在深度學習擴展方面最新里程碑,GPT-4 是一個大型多模態模型(接受圖像和文本輸入、輸出),雖然在許多現實場景中的能力不如人類,但在各種專業和學術基準測試中表現出人類水平的性能。例如,它在模擬律師資格考試中的成績位于前 10%的考生,而 GPT-3.5的成績在后 10%。GPT-4 不僅在文學、醫學、法律、數學、物理科學和程序設計等不同領域表現出高度熟練程度,而且它還能夠將多個領域的技能和概念統一起來,并能理解其復雜概念。

    除了生成能力,GPT-4 還具有解釋性、組合性和空間性能力。在視覺范疇內,雖然 GPT-4 只接受文本訓練,但 GPT-4 不僅從訓練數據中的類似示例中復制代碼,而且能夠處理真正的視覺任務,充分證明了該模型操作圖像的強大能力。另外, GPT-4 在草圖生成方面,能夠結合運用 Stable Difusion 的能力,同時 GPT-4 針對音樂以及編程的學習創造能力也得到了驗證。

    2)谷歌:大模型基礎理論貢獻者

    谷歌對人工智能的貢獻,尤其是對基礎理論的貢獻是不言而喻的,即便在聊天機器人上被 OpenAI 捷足先登,但誰也不敢小覷谷歌的實力,其推出了 BERT 模型、LaMDA 模型、Switch Transformer 模型、通用稀疏語言模型 GLaM、PaLM-E 多模態視覺語言模型(VLM)等多個基礎模型來多方面提高大模型性能。

    谷歌最早在 2017 年提出 Transformer 網絡結構,成為過去數年該領域大多數行業進展的基礎。隨后在 2018 年,谷歌提出的 BERT 模型,在 11 個 NLP 領域的任務上都刷新了以往的紀錄。和 GPT 相比,BERT 最大的區別就是使用文本的上下文來訓練模型,而 GPT 專注于文本生成,使用的是上文。BERT 使用了 Transformer 的 Encoder 和 Masked LM 預訓練方法,因此可以進行雙向預測。而 OpenAI GPT 使用了 Transformer 的 Decoder 結構,利用 Decoder 中的 Mask 只能順序預測。BERT 無需調整結構就可以在不同的任務上進行微調,在當時是 NLP 領域最具有突破性的一項技術。

    2023 年 2 月 6 日,谷歌推出聊天機器人 Bard Bard 背后是 LaMDA 在提供后端支撐。LaMDA 是繼 BERT 之后,谷歌于 2021 年推出的一款自然對話應用的語言模型,可以實現擬物化與用戶交談。

    此外,谷歌還推出了 Switch Transformer 模型,該模型進一步提升大模型參數,可實現簡單且高效計算;推出的通用稀疏語言模型 GLaM 訓練成本抵御 GPT-3,相同數量下的表現也有提升;2023 年 3 月,谷歌和柏林工業大學 AI 研究團隊推出了迄今最大視覺語言模型--PaLM-E 多模態視覺語言模型(VLM)。該模型較 ChatGPT 新增了視覺功能。

    3)百度文心一言:國內首個大模型發布者,AI 應用場景覆蓋廣

    2023 年 3 月 16 日,百度官方發布“文心一言”。“文心一言”是百度研發的知識增強大語言模型,擁有文學創作、商業文案創作、數理邏輯推理、中文理解和多模態生成五大能力。文心一言在百度 ERNIE 及 PLATO 系列模型基礎上研發而成,關鍵技術包括監督精調、人類反饋的強化學習、提示、知識增強、檢索增強以及對話增強。其中,百度在知識增強、檢索增強和對話增強方面實現技術創新,使得文心一言在性能上實現重大進步。

    在商業模式上,文心一言或將提供大模型 API 相關功能。技術上來說,文心大模型已經具備了搜索、文圖生成等功能,并成功得到應用,這些能力或將集成于文心一言。此外,據百度官方信息,文心一言或將提供大模型 API 相關功能。目前,文心大模型提供的大模型 API 包括 ERNIE-ViLG 文生圖和 PLATO,以及正在開發的 ERNIE 3.0 文本理解與創作。ERNIE 3.0 文本理解與創作與文心一言官網相關聯,能夠認為,文心一言等生成式對話產品或將同樣提供大模型 API 相關功能。

    文心千帆提供開發運維管理一體化服務平臺。3 月 27 日,百度于首批測試企業閉門溝通會中正式推出企業級“文心千帆”大模型平臺,其中包括文心一言在內的大模型服務,還提供相應的開發工具鏈及整套環境,未來文心千帆還會支持第三方的開源大模型,并探索具體應用場景。

    4)MiniMax:國內大模型創業企業,新晉獨角獸

    MiniMax 成立于 2021 年 12 月,具備自研文本、語音等多模態融合的通用大模型能力,目前自研了文本到視覺(text-to-visual)、文本到語音(text-to-audio)、文本到文本(text-to-text)三個模態的基礎模型架構,并在基礎模型之上構建起一個計算推理平臺。

    MiniMax 聯合創始人為前商湯科技副總裁、通用智能技術負責人閆俊杰,也曾擔任商湯研究院副院長。公司法定代表人、技術合伙人楊斌,則曾于 2014 年在中科院自動化所讀碩士,在加拿大讀完博士后,先后在 Uber AI 研究院,以及自動駕駛卡車領域有多年研發經驗。

    MiniMax 是國內通用大模型創業企業,2023 年 6 月拿到了騰訊等機構投資的 2.5 億美元新一輪融資,成為國內大模型創業企業中單筆融資最高的企業,估值超 10 億美元,成為國內大模型領域少有的獨角獸。此前,MiniMax 已完成兩輪融資,投資方包括米哈游、IDG 資本、高瓴創投、云啟資本以及明勢資本等。

    To C 端,2022 年 11 月,MiniMax 發布虛擬聊天軟件產品 -Glow,在 Glow 里,用戶可以根據喜好創建有背景設定、有特定性格的智能體。通過內容生成與用戶反饋,不斷迭代背后大模型的 AI 能力,有一些類似 ChatGPT 背后的 RLHF。

    2023 年 3 月 MiniMax 又上線了其自主開發的生成式對話 AI,背后大模型基于 Transformer,名為 Inspo,該 AI 定位于人工智能助手,具備寫作、獲取信息、提供建議等多項功能。

    To B 端,2023 年 3 月,MiniMax 推出了面向企業用戶的 API 開放平臺,支持文本和語音模型的服務調用。

    5)智譜 AI:千億級超大規模預訓練模型

    智譜 AI 成立于 2019 年,由清華大學計算機系知識工程實驗室的技術成果轉化而來。隨著 20 年 GPT-3 的問世及火遍全球,智譜 AI 也開始全力研究大模型并研發預訓練架構。

    2021 年 9 月,公司發布了一個百億大模型。在 2022 年 8 月,智譜 AI 發布了千億級超大規模預訓練模型 GLM-130B,并主導構建高精度通用知識圖譜,把兩者有機融合為數據與知識雙輪驅動的認知引擎。2023 年 3 月,公司研發了對話模型 ChatGLM,開始全面對標 ChatGPT。緊接著發布單卡開源版本 ChatGLM- 6B、多模態對話模型 VisualGLM-6B 并開源,升級對話模型 ChatGLM2。5 月 16日,360 集團和智譜 AI 宣布達成戰略合作,雙方共同研發千億級大模型“360GLM”。

    基于大模型基礎智譜 AI 布局 AIGC,智譜 AI 推出了認知大模型平臺 Bigmodel.ai,形成 AIGC 產品矩陣,包括高效率代碼模型 CodeGeeX、高精度文圖生成模型 CogView 等,提供智能 API 服務。也通過認知大模型鏈接物理世界的億級用戶、賦能元宇宙數字人、成為具身機器人的基座。

    今年智譜 AI 已完成 B-2 輪融資,金額為數億人民幣,由美團戰投獨家投資,該輪投后估值為近 5 億美金。

    6)第四范式:國產 AI 獨角獸

    第四范式成立于 2014 年,是一家人工智能技術與服務提供商,業務是利用機器學習技術和經驗,通過對數據進行精準預測與挖掘揭示出數據背后的規律,幫助企業提升效率、降低風險,獲得商業價值。2020 年 4 月 2 日,第四范式完成 C+輪融資,C 輪總計融資金額達 2.3 億美元,投后估值約 20 億美元,并在 2022 年向港交所提供上市申請,于今年 7 月 3 日獲得中國證監會的批準。

    目前,第四范式已經完成超過 2000 個 AI 落地案例,服務領域包括金融、醫療、政府、能源、零售、媒體等。例如金融方面,第四范式與各大銀行合作,深入底層系統共建 AI 應用體系,升級為以高維機器學習模型為主的實時智能決策系統,從信息化向智慧化發展。目前,第四范式服務的金融機構資產總規模超過 50 萬億。在醫療方面,第四范式與三甲大型綜合性教學醫院上海瑞金醫院合作的 “瑞寧知糖”系列項目聚焦于虛擬代謝人研究和慢性病管理,目前已經在 30 多個省市的 400 多家醫院投入使用。

    今年 4 月 26 日,第四范式展示其大模型產品“式說 3.0”,并首次提出 AIGS 戰略(AI-Generated Software):以生成式 AI 重構企業軟件。此大模型經歷了 3 個階段,第一個階段是式說 1.0,解決 GPT 技術應用時內容可信、數據安全和成本的三大問題,主要應用于文庫問答。第二階段為式說 2.0,在上一階段的基礎上加入文本、語音、圖像、表格、視頻等多模態輸入及輸出能力,增加了企業級 Copilot 能力。以與企業內部應用庫、企業私有數據等進行聯網,對信息和數 據進行分析。第三階段在生成式和語言能力的基礎之上,發力 Copilot 和思維鏈 COT(多步推理、復雜任務拆分、形成數據飛輪),改造傳統 B 端企業軟件的體驗與開發效率。

    第四范式今年合作多家基于其大模型產品。3 月 23 日,龍芯中科與第四范式進行戰略合作,基于 LoongArch(龍架構)的 4Paradigm Sage AIOS 一體機已完成與龍芯 3C5000 系列芯片的深度適配工作,在龍芯 CPU 上實現 AI 訓練及推理能力。5 月,我愛我家與第四范式合作,打造行業首個房產經紀大模型,提高知識、系統、人三者的融合度,提升智能決策水平,助推房產領域智能決策 AI+大模型生成式 AI 雙輪驅動。

    利潤方面第四范式連續三年出現凈虧損。根據招股書,2020 年至 2022年,第四范式收入分別為 9.42 億元、20.18 億元、30.83 億元,同比增速為 105.0%、114.2%、52.7%。在凈利潤方面,第四范式虧損凈額分別為 7.50 億元、18.02 億元及 16.53 億元。

    5、小結

    從數量來看,截至目前,國內大模型發布數量與美國差距不大,但從整體的影響力來看,國內大模型還沒像 OpenAI、谷歌一樣形成世界性的影響力,此外,由于大模型對人才、資本和技術的制約,國內一級市場對大模型項目的投資并不如美國那樣火熱,國內更傾向于利用龍頭企業的開源模型來做應用落地的創業。

    關于國內大模型與美國的大模型的差距,業內人士看法不一,李彥宏曾表示,文心一言和 OpenAI 差距大概是一兩個月,科大訊飛創始人、董事長劉慶峰也曾表示,中國 AI 領域的算法沒有問題,但算力似乎始終被英偉達按住,他承認目前與 ChatGPT 還有一定的差距,但也表示 2023 年 10 月份,科大訊飛將發布通用大模型,全面對標 ChatGPT ,且要實現中文全面超越,英文跟它相當。到 2024 年上半年對標 GPT-4。而搜狗創始人王小川則認為,OpenAI 領先國內三年時間,但 2023 年 6 月,他去硅谷做了一番考察后,他認為國內應用層做的更出色,起碼快美國三步。

    美國濃厚的工程師文化,使得美國在基礎研究上保持領先地位,但也可以發現,許多工程師對于大模型的應用并沒有什么經驗,此外落地應用涉及的交付、維護等環節需要人力支持,美國在這方面并無優勢,反而是國內企業創業的初衷就為落地而去,可能會在落地應用上領先一步。

    三、中美 AI 大模型在千行百業的賦能表現

    大模型能否落地一方面取決于大模型的性能,另一方面與所落地行業的特點是分不開的。數據是大模型的基礎燃料,這就意味著數據量大、數據質量高、數據多樣性強的行業能夠為大模型提供充足的訓練和微調的數據,而技術需求高、創新能力強、競爭激烈的行業自身就有著擁抱新技術的熱情,這些因素決定下,大模型在各國、各行業的成熟度并不一致,在各個應用落地的表現也有所不同。

    目前,國內外大模型已在辦公、教育、醫療、金融、文娛、交通等領域落地應用,從行業滲透率來看,金融業的滲透率最高,已達 78%,在微軟、金山辦公等龍頭企業的帶動推廣下,在辦公領域的滲透率也比較可觀,而能源和建筑行業的滲透率較低。

    1、AI+辦公:美國巨頭引領潮流,國內廠商奮起直追

    如果說, 自動化是解放藍領,那么 AI 大模型便是來解放白領的,在微軟、Adobe 等美國辦公軟件巨頭的引領下,大模型在辦公領域的滲透迅速展開。國內金山辦公、福昕軟件等辦公軟件龍頭企業也一直在探索 AI 與辦公產品的結合。

    用戶可以通過大模型進行文檔摘要和自動化翻譯,提高文檔處理的效率;通過語音識別和自然語言處理技術實現語音助手,幫助用戶處理日常任務和安排會議;通過自動化的數據處理和分析,提供決策支持等,促進團隊間的溝通和合作。大模型在信息管理和知識管理方面也發揮重要作用能夠實現智能搜索、文檔自動分類和知識圖譜構建,幫助員工更輕松地獲取和利用內部和外部的知識資源。大模型還可以應用于智慧辦公的單據管理和報銷流程。通過圖像識別和文本分析,大模型可以自動識別和分類各種單據,如發票、收據、報銷申請等。

    目前在 AI 大模型+辦公領域,更多還是成熟企業通過接入外部龍頭大模型,來給原有產品增加更多 AI 功能,在該領域的創業項目并不多。

    1)微軟:智能辦公引領者

    2023 年 3 月 16 日,微軟正式發布 Microsoft 365 Copilot,并集在微軟 365 的多個應用程序中,包括 Word、 Excel、PowerPoint、Outlook、Teams 等。它集成了 GPT-4 的功能,以聊天機器人的模式出現在產品的右側。用戶通過向其發號指令,便可自動生成文字、表格、演示文稿等內容。

    Microsoft 365 Copilot 可以根據用戶的簡短提示,在 Word 中生成文檔的初稿。在 Excel 中幫助用戶分析數據,生成圖表和報告,并提供有用的見解和建議。在 PowerPoint 中創建漂亮的幻燈片,并根據用戶在微軟圖形中的數據添加相關內容。在 Teams 中幫助用戶協作溝通,分享信息,創建任務和計劃,并提供相關的反饋和建議。遵循微軟對數據安全和隱私的承諾,在企業環境中保護用戶的數據不被濫用或泄露。在 Outlook 中幫助用戶管理日程安排,回復郵件,編寫摘要和提綱,并提供適當的語氣和禮貌。

    Microsoft 365 Copilot 的推出為微軟提供了新的收入增長點,根據國泰君安研報預測,2022 年 Microsoft365 機構訂閱的 ARPU 約為 103 美元,此次 Copilot 服務的試點價格有望推動 ARPU實現接近翻倍增長。

    2)金山辦公:國內辦公龍頭,已接入多個大模型

    金山辦公是國內辦公軟件龍頭,也是最早探索 AI 技術落地辦公應用的先行者。2017 年,AI 在金山辦公內部首次被提升到戰略層面,2018 年正式提出多屏、內容、云、AI 的發展戰略。

    金山辦公已經將公司的產品逐步添加 AI 功能,比如智能美化、智能校對、智能輔助寫作、全文翻譯、圖像識別等。此外,金山辦公還接入了多個大模型供應商,來滿足用戶 AI 創作需求,目前已接入 MiniMax、百度文心、 CopyDone 等大模型。

    2023 年 4 月 18 日,金山辦公發布了 WPSAI 的 Demo 演示視頻,官宣 WPSAI 將嵌入金山辦公全線產品。率先進入內測階段的是具備 AI 能力的 WPS 輕文檔,這是一款對標 NotionAI 等輕辦公產品的在線內容協作編輯工具,可以借助大模型自動生成新聞稿、工作周報、運營策劃案等;也可以實現多輪對話,持續就某個主題進行討論;也可以對現有文檔進行改寫、擴寫、縮短、潤色等;還可以對指定文檔生成主旨摘要、文章大綱等功能。

    2、AI+金融:美國發展較成熟,國內也已進入應用階段

    AI+金融指人工智能與金融的全面融合,以人工智能、大數據、云計算、區塊鏈等高新科技為核心要素,全面賦能金融機構,提升金融機構的服務效率,拓展金融服務的廣度和深度,使得全社會都能獲得平等、高效、專業的金融服務,實現金融服務的智能化、個性化、定制化。AI 應用場景涵蓋前中后臺中的市場營銷、產品設計、風險管控、客戶服務、運營支持等。據艾瑞咨詢統計測算,2021 年 AI+金融核心市場規模達到 296 億元,帶動相關產業規模 677 億元,到 2026 年,核心市場規模達到 666 億元,CAGR 為 17.6%,帶動相關產業規模 1562 億元,CAGR 為 18.2%。數據顯示,美國金融 AI 占比整體 AI 領域融資的 6.7%。

    在 AI 大模型在金融領域的應用中,美國開發應用時間較早,并且掌握核心技術。目前已覆蓋金融各領域,尤其在金融服務方面取得不小建樹,應用趨近成熟。根據咨詢公司 Evident 的最新數據,目前美國銀行的招聘中,約 40%的空缺職位是與人工智能相關的職位,例如數據工程師和量化分析師,以及合規、道德治理等職位。摩根大通從 2023 年 2 月到 4 月在全球招聘 3651 個與人工智能相關的職位。美國在金融領域已成熟應用 AI 大模型處理金融業務,提供金融服務。

    國內 AI+金融目前也已進入應用階段,例如中國農業銀行推出的大語言模型 服務 ChatABC,與美國對比,我國該領域開發投資積極性占比較高,疊加近期數據政策支持,有望追平美國 AI 大模型在金融領域的應用發展水平。

    1)彭博 BloombergGPT:開啟大模型在金融行業的開發和應用的第一步

    2023 年 3 月,彭博社發布了專門為金融領域打造的大型語言模型(LLM)——BloombergGPT。

    金融領域的復雜性和獨特的術語需要特定領域的模型,BloombergGPT 代表了這項新技術在金融行業的開發和應用的第一步。該模型將協助彭博改進現有的金融 NLP 任務,例如情感分析、命名實體識別、新聞分類和問答等。此外,BloombergGPT 將釋放新的機會,整合彭博終端上的大量可用數據,以更好地幫助該公司的客戶,同時將人工智能的全部潛力帶入金融領域。

    彭博支持大量且多樣化的 NLP 任務,這些任務將受益于新的金融感知語言模型。彭博研究人員還開創了一種混合方法,將財務數據與通用數據集相結合,訓練一個模型,在財務基準上取得不錯的結果,同時在通用 LLM 基準上保持競爭性。

    BloombergGPT 在兩大類 NLP 任務中的表現:金融專業任務和一般任務。

    彭博的機器學習產品和研究團隊與公司的人工智能工程團隊合作,利用公司現有的數據創建、收集和管理資源,構建了迄今為止最大的特定領域數據集之一。作為一家金融數據公司,彭博的數據分析師在四十年的時間里收集并維護了金融語言文檔。該團隊從龐大的金融數據檔案中提取數據,創建了一個由英文金融文國詠合車檔組成的包含 3630 億個代幣的綜合數據集。

    2)Lemonade:大模型在保險領域的試水者

    Lemonade 是一家保險公司,他們應用大模型打造了 Maya 與 Jim。機器學習驅動的 Maya 個虛擬助手,可以收集信息、提供報價并處理付款。Maya 是一個功能強大的機器人,可確保客戶在 3 分鐘內收到付款并在 90 秒內獲得保險。Maya 利用災難早期檢測系統可以對正在發生的災難做出實時反應。該機器人會自動封鎖區域,并向 Lemonade 的人工索賠團隊發出潛在緊急情況的警報。Maya 還會幫助該公司在附近發生火災和惡劣天氣事件時通知用戶。使用 AIMaya 不僅可以獲得疑難問題的定制即時答案,還可以幫助他們更改現有政策。Maya 聊天 越多它就越聰明,因為機器學習模型幾乎每天都會重新訓練。Maya 由 NLP(自然語言處理)和 NAS(自然動作合成)推動。

    Jim 也是機器學習驅動的機器人。據悉,它能夠在沒有任何人為參與的情況下管理整個索賠流程。2019 年,Jim 處理了約 20000 項索賠,并在無人參與的情況下支付了約 250 萬美元。為 AIJim 提供支持的機器學習算法可以讀取索賠的性質、嚴重程度以及客戶是否處于緊急狀態。除此之外,AIJim 還調查了虛假索賠的可能性。它通過將多年的行為經濟學研究結合到對話中的每一個微小細節中,促使人們變得更加誠實,可以平均跟蹤 370 萬個信號。

    3)中國農業銀行 ChatABC:中國銀行業大模型應用探索者

    ChatABC 是中國農業銀行推出的大語言模型服務。中國農業銀行大語言模型是基于農行數據中臺算法、算力、數據基礎,結合開源通用大模型技術自主研發的人工智能對話機器人服務。

    ChatABC 重點著眼于大模型在金融領域的知識理解能力、內容生成能力以及安全問答能力,對于大模型精調、提示工程、知識增強、檢索增強、人類反饋的強化學習(RLHF)等大模型相關新技術進行了探索和綜合應用,結合農業銀行研發支持知識庫、內部問答數據以及人工標注數據等金融知識進行融合訓練調優,實現了金融知識理解和問答應用。

    1.0 版本 ChatABC 大模型擁有百億級參數,可初步具備自由閑聊、行內知識問答、內容摘要等多類型任務的服務能力,已在行內多個渠道以多輪問答助手、工單自動化回復助手等形式面向內部員工開放試用,并可通過 MaaS(ModelasaService)方式面向其他場景提供一站式決策輔助服務,未來將逐步形成大模型服務生態。

    3、AI+醫療:數據制約下,國內滲透緩慢,美國數據優勢明顯,青睞研發環節

    AI 大模型在醫療領域的應用場景可分為診前、診中、診后,涉及診前的藥物研發、基因研究、預約就診、預檢分診以及導診,診中的臨床診斷、臨床治療、病歷錄入及藥物檢索,診后的醫保支付、報告獲取、患者隨訪、康復管理及遠程醫療等。

    根據 Frost&Saliv數據顯示 2020-2025 年 I+醫療市場規模呈現高增長狀態,市場總規模在 2025 年將達 348 億元,增速維持在 40%左右。根據觀研數據中心數據顯示 AI 人工智能細分市場中,影像、數據交換與存儲、綜合輔助診斷占比較高,占比分別為 34%、22%、13%。據動脈橙數據顯示,從 2022 年 1 月 1 日至 2023 年 6 月 28 日全球生成式 AI 醫療領域累計投融資事件超過 160 起,累計投資金額超 57.1 億美元。

    可以說, AI+醫療市場前景廣闊,一級市場活躍。

    美國較早推行了醫療信息化,醫療行業有著豐富的結構化的數據,這也方便了美國企業在研發端發力,其中微軟、谷歌、英偉達等科技巨頭在 AI 醫療領域 布局積極,比如谷歌早在 2014 年就收購了 DeepMind 2016 年 DeepMind 就提出將算法應用到醫療保健領域,目前谷歌和 DeepMind 團隊發布的醫療大模型 Med-PaLM 在醫學考試中已經基本接近“專家”醫生水平,2022 年 7 月 DeepMind 進一步破解了幾乎所有已知的蛋白質結構,其 AlphaFold 算法構建的數據庫中包含了超過 2 億種已知蛋白質結構,為開發新藥物或新技術來應對饑荒或污染等全球性挑戰鋪平了道路。

    從國內來看,目前影響大模型在醫療領域滲透的主要問題在于數據,一方面醫療行業數據量非常大、質量較差,將醫療行業的數據進行整理清洗需要一個過程;另一方面醫療行業數據涉及患者隱私和國家安全等敏感信息,數據開放度低。盡管面臨著數據困難,但國內科技企業一直在迎難而上,比如華為盤古大模型已經助力藥品開發,百度文心一言發布了落地醫藥行業的產品 GBI-Bot,京東健康發布了“京醫千詢”醫療大模型等等。

    從一二級市場來看,對于大模型+醫療,二級市場更多關注的是原有醫療信息化企業產品的智能化,而一級市場更多關注大模型在醫藥研發、輔助診斷等方面的應用。

    1)醫聯:國內首款醫療大模型 medGPT 發布者

    2014 年,醫云科技,即醫聯,成立于四川成都,先后得到了紅杉中國、騰訊、云鋒基金、招銀國際、華興資本等國內知名機構的投資,最新一輪融資是 2021 年 12 月,由中國生物制藥投資的 5.14 億美元的 E 輪融資,估值近 40 億美元。

    醫云科技是一家醫療解決方案提供商,旗下擁有醫聯通、醫聯 ME 和醫聯 APP 等產品,業務覆蓋疾病篩查、醫生教育、診療服務、藥品配送、金融保險等服務。

    2023 年 4 月 28 日,醫聯宣布成功研制國內首款大模型驅動的 AI 醫生 medGPT,medGPT 是基于 Transformer 架構,目前參數規模為 1000 億,可支持醫療場景下的多模態輸入和輸出。其中,預訓練階段使用了超過 20 億的醫學 文本數據,微調訓練階段使用了 800 萬條的高質量結構化臨床診療數據,并投入超過 100 名醫生參與人工反饋監督微調訓練。

    medGPT 突破了 AI 醫生無法與真實患者連續自由對話的難點,并在醫療問診場景中支持多模態的輸入和輸出,在疾病的預防、診斷、治療、康復四個重要環節實現智能化。

    為驗證 medGPT 的診斷準確率,醫聯抽取了 532 名復診患者檔案進行信息脫敏,并進行了模擬首診實驗。結果顯示,醫聯 medGPT 的診斷結果與患者原有線下門診的診斷吻合率超過 97.5%,證明了 AI 醫生在醫療領域的價值和潛力。

    2)云知聲:基于山海大模型的門診病歷生成系統

    云知聲,成立于 2012 年,是一家專注于物聯網人工智能,擁有自主知識產權的智能語音人工智能企業。云知聲業務主要覆蓋智慧生活和智慧服務兩大場景,在包括家居、 車載、醫療、教育、政府、機器人等領域擁有廣泛布局。

    2023 年 5 月 26 日,云知聲發布“云知聲山海大模型”,并基于該模型發布了手術病歷撰寫助手、門診病歷生成系統、商保智能理賠系統三大醫療產品應用。

    其中,門診病歷生成系統實現了診室復雜環境下的降噪、醫患角色區分、信息摘要及病歷自動生成等功能。預計可提升醫生的電子病歷錄入效率超過 400%,節約單個患者問診時間超過 40%,提升醫生門診效率超過 66%。

    4、AI+文娛:美國發展遇阻力,我國有望彎道超車

    最近基于大模型的 AIGC 技術在影視、游戲、音頻、動漫等多個領域落地應用,給數字文娛產業帶來了可預見的巨大價值。AI 不僅能夠幫助企業提高內容生產的效率,也能生成更加豐富多元、動態且可交互的內容,進而優化傳統互動模式。AI 正從激發生產力、打造新內容、構建新體驗多層面重塑著數字文娛行業。

    大部分技術的起源在于美國,而美國理所當然地在 AI+文娛領域發展最早,并衍生多個大模型應用。不過近期美國 AI+文娛產業發展似乎受到較大的阻力。這主要體現在影視動漫領域以及音樂產業。2023 年迪士尼旗下漫威發布新片《秘密入侵》,因其片頭為 AI 工具生成,而受到網上輿論猛烈抨擊,并且此前的 AI 音樂同樣受到大量抨擊。

    我國 AI+文娛發展有著多元化的特征,各個產業領域基本被覆蓋,尤其頭部公司,如華為、阿里等更是擁有著較為成熟的大模型。不過核心技術的開發創新仍值得我們重視,目前大部分模型技術及底層邏輯仍是借鑒美國,在部分領域我們仍與美國存在較大差距,例如游戲與語言生成技術。依托龐大的市場需求,在市場發展方面,未來我國有望彎道超車。

    1)攜程:首個旅游行業垂直大模型“攜程問道”

    近期攜程發布了首個旅游行業垂直大模型“攜程問道”,該模型自 2022 年開始研發。

    攜程在旅游業多年,積累了大量行業數據,為其行業大模型提供了充足的數據依靠。據報道,“攜程問道”作為垂直大模型,實現了篩選 200 億高質量非結構性旅游數據,結合攜程現有精確的結構性實時數據以及攜程歷史訓練的機器人和搜索算法,進行了自研垂直模型的訓練。

    AI 大模型的應用,可以為在線旅游平臺創造更多的價值,助力企業實現降本增效,比如提高客服效率,為消費者進行線路規劃,為消費者所遇到的景點、酒店等等各種疑問提供解答,從而節省消費者的決策時間。

    “攜程問道”可以為有明確規劃的用戶提供查詢和引導預訂的服務,為無明確規劃的用戶提供出行推薦服務,從而減少所需要的決策時間,為用戶帶去更加方便、快捷的旅游體驗。

    2)華為云盤古大模型:在數字文娛產業全面發展

    華為云在影視動漫、數字內容、游戲等領域有著廣泛應用。

    在影視動漫領域,華為云將渲染任務搬到云上,通過烏蘭察布云數據中心的百萬核算力資源實現了“萬核渲一圖”。華為云的 MetaEngine 云原生智能渲染引擎,將人工智能與計算機圖形技術相結合,實現了 AI 渲染加速,讓內容制作走上快車道。

    在數字內容領域,華為云通過對 PB 級的音視頻數據進行訓練,讓數字人的生產效率得到極大提升,讓每個人實現“數字人自由”。

    在游戲領域,華為云可以幫助游戲美術設計師確定游戲風格,輔助世界觀框架、劇情及玩法的創意設計,優化玩家的和 NPC 交互方式和體驗。

    華為云盤古大模型 3.0 包括三層架構來滿足行業應用大模型需求。在 L0 層,華為云通過 5 個基礎大模型提供滿足行業場景的多種技能;在 L1 層,華為云提供使用行業公開數據訓練的行業通用大模型,客戶也可以基于自有數據,便捷地訓練自己的專有大模型;在 L2 層,華為云為客戶提供更多細化場景的模型,開箱即用。

    3)阿里大文娛:“提香”大模型引領妙鴨相機產品爆火

    阿里大文娛是阿里拆分后的六大板塊之一,集團實行董事會領導下的 CEO 負責制,并用 AIGC 將技術維度劃分成 C 端和 B 端兩部分 C 端是通過投資和自研,產出妙鴨相機等應用 B 端是用外部 AI 通用大模型賦能集團的影視、視頻生產。

    妙鴨相機是一款基于 AI 人臉識別的美圖應用,用戶花費 9.9 元上傳 20 張多光線、多視角、多表情的上半身個人照片,就能生成一整套 AI 寫真,可以選擇商務寫真、時尚海報、證件照、校園照、懷舊黑白風、古風隨拍等多種風格。

    5、AI+教育:美國側重輔助教師,中國側重應試

    AI+教育同樣是 AIGC 的重要落地方向。教育行業具備成熟的產業信息化基礎、用戶基礎、底層數據資源,AIGC 產業鏈已初具雛形,其應用方向是“高頻迭代”+“個性化需求”的場景。教育場景與 AI 應用方向高度契合。民生證券指 出目前 AI+教育應用及產品主要包括硬件端及軟件/解決方案。硬件端(TOB/C)指終端或平臺嵌入 AI 能力,學長、家長、老師可以通過平臺去觸達相應課程或學習相關的內容;低齡兒童的啟蒙教育和口語訓練;學校的數字化轉型和教研系統的定制研發:包括智能課程系統、考試系統和閱卷系統;軟件/解決方案(TOB)指典型的應用包括智慧校園系列,早期應用表現為普通話考評,線上口語測評和打分;隨著技術持續改進,老師可基于升級系統進行課程內容規劃和給出對應訓練題,此外,目前也具備批改題目及給出教學方案的功能。

    在市場端開發及應用方面,美國更多體現在對于考試及作業的輔助評分,減少教師時間成本及提高效率。而中國目前發展主要應用在考試準備方面,以智能篩選題目及押題為主。

    1)Gradescope:作業批改模型

    Gradescope 是一家美國教育科技公司,為高等教育提供在線和人工智能輔助評分工具。該公司成立于 2014 年,總部位于加利福尼亞州伯克利。

    該公司的評分軟件提供了用于對筆試、家庭作業以及自動評分提交的代碼進行評分的工具。目前 Gradescope 使用大模型幫助老師對學生的表現評分,幫助老師節省時間,讓老師們能夠做更多事情教學。

    到目前為止 Gradescope 已經為全球超過 200 家機構批改了超過 1200 萬頁的學生作業。

    2)好未來 MathGPT:國內首個數學大模型

    好未來的前身即學而思,2013 年 8 月 19 日正式更名為好未來。2010 年 10 月,好未來的前身學而思在美國紐交所正式掛牌交易,成為國內首家在美上市的中小學教育機構。好未來布局教育產業較為全面,構建智慧教育、教育云、內容及未來教育、K12 及綜合能力和國際及終身教育五大事業群,旗下共有學而思、學而思網校、愛智康、摩比思維、勵步英語、順順留學、家長幫等 15 個業務品牌。

    8 月 24 日,好未來 CTO 田密宣布該公司自研的數學領域千億級大模型 MathGPT 正式上線并開啟公測。 MathGPT 主要面向全球數學愛好者和科研機構,是以解題和講題算法為核心的數學垂直領域的大模型,也是國內首個專為數學打造的大模型。MathGPT 專注于數學領域,可以實現題目計算、講解、問答等多任務持續訓練和有監督微調。

    使用 MathGPT 時,用文字或圖片方式上傳數學題,即可得到對話式的解答反饋,也可以通過“隨機來一題”的按鈕,隨機生成數學題目并由系統給出解答。目前 MathGPT 支持中文、英文版本的 PC 端和移動端體驗。MathGPT 官網顯示 MathGPT 的數學計算能力已覆蓋小學、初中、高中的數學題,題目類型涵蓋計算題、應用題、代數題等多個類型。

    MathGPT 技術報告顯示,在 CEval-Math、AGIEval-Math、APE5K、CMMLU- Math、高考數學和 Math401 等 6 個公開數學評測集合的測試結果中,好未來的MathGPT 取得了多項測試的最高分數。同時 MathGPT 在 C-Eval 的初高中的全科測試集合上也均有不錯的表現。

    6、AI+交通:交通應用中國具備優勢,智能駕駛中美處于競爭狀態

    大模型有協同和交互的本質,以及系統協同、信息共享、內容自動生成等特征,使其能夠提升交通管理的效率和便捷性,如語音交互、知識庫調用交互,各類助手、數字人、信息協同、系統聯動、內容整合、報告生成、資源(指令下發)調配等,在智慧交管、智慧高速、智慧交運等領域都有所應用。

    大模型可以通過算力×數據×算法的深度整合能力,結合交管日常業務,在定性和定量兩個維度進行拓寬和深化。定性方面,大模型統一交管內勤 OA 業務入口,而非應用鏈接層面的統一;成為內勤 OA 業務辦公的 AI 助手;內勤模型知識涌現可使大模型成為交管內勤業務專屬“知識庫”。定量方面,大模型可有機統一交通信號控制、交通狀態分析等應用系統的入口,成為交管指揮調度 AI 助手,通過交通系統運行知識涌現,成為城市交通系統的“知識庫”。通過將定性+定量進行結合,可打通交管內勤業務和外勤業務,秒級將交通系統數理知識和運行數據轉化為內勤文檔,內勤業務指令轉化為交通系統運行管控指令。

    自動駕駛汽車離不開感知、決策和執行這 3 個部分,自動駕駛的核心目標就是在不需要人為干預的情況下,可以安全、高效地行駛和完成各種任務,AI 大模型的出現為自動駕駛的實現提供了強大的技術支持。

    AI 大模型在交通領域的應用具有以下優勢,首先模型實現自動交通規則學習,其次技術上可以提高自動駕駛系統的安全性和穩定性,并且 AI 大模型能夠對道路上的信息進行高效處理,提供精準的感知和決策能力,此外 AI 大模型具有較強的可迭代性和適應性,最后 AI 大模型可以從多個自動駕駛車輛中收集數據,并通過聯合學習的方式進行模型的優化。

    目前在交通的大模型應用上,我國具備了較大優勢,較美國處于領先地位。我國政府在環境授權和放松管制方面所做的努力,在國內培育了一個友好的環境。隨著中國政府不斷放寬道路規范,數據收集就變得相對容易,進而讓國內科技公司受益。

    在自動駕駛方面我國與美國正處于競爭狀態,從開始美國的領先到現在我國已具備競爭市場份額的實力。我國計劃約在 2040 年完全淘汰內燃機,這使得我國成為最大的電動汽車市場,未來有可能會成為全球最大的自動駕駛市場,在政策的支持力度以及市場需求方面,我國未來很大可能居于全球首位。這有利于對國內科技公司催化,產出更優的技術應對龐大的市場需求。

    1)百度:基于交通大模型的全域信控緩堵解決方案

    在交通行業領域,百度首個定義大模型與交通結合的應用場景。

    3 月,百度基于文心大模型在高速公路領域發布了數字人簡璐璐;4 月 18 日,在長沙 2023 中國道路交通安全創新與合作大會上,百度發布“基于交通大模型的全域信控緩堵解決方案”,打響了交通大模型應用的第一槍。

    百度發布的基于交通大模型的全域信控緩堵解決方案是百度在芯片、框架、大模型、應用場景等全棧布局下的一個典型現象級應用。

    該方案底層包括實時感知、機器視覺、交通預測、問題診斷、策略推薦、配時優化、個性化提示等交通大模型,能夠提供全域感知、全域優化、全域協同和全域服務四大能力,實現信控優化的代際提升,可實現超千規模路口的全域擁堵治理。

    依托文心大模型的能力,百度通過在智能交通領域打造交通大模型,構建交通感知、決策、認知、預測的完整能力,重構已有解決方案和產品,可全面升級 G 端(交通管理)/B 端(交通運輸)/C 端(出行服務)的交通場景應用和用戶體驗。

    最新發布的 18.5.0 版本的百度地圖,結合文心交通大模型 beta 版能力,全面提升車位級導航、車道級導航、隧道導航、紅綠燈倒計時、實時公交地鐵等產品體驗。據了解,文心交通大模型 Beta 版是面向實時交通場景的大模型,可實現對實時交通數據的刻畫、感知、預測和調度,從而為用戶提供更加精準、高效、安全的導航服務。

    在高速公路領域,百度聯合河北高速集團發布了基于交通大模型的數字人簡璐璐。作為高速行業專家、業務助手、出行伴侶和形象大使,“簡璐璐”服務于路網監測、應急指揮、養護管理、公眾出行全環節,可以結合用戶問題,提供全新對話式交互,實時給出精準答復,讓設施更簡約、流程更簡化、溝通更簡單、服務更簡潔。

    傳統的高速業務系統主要是頁面型展示,指標和報表都相對固化,展示內容單一,難以支持全局評估。在這種情況下,百度打造基于數字人的全新交互體驗,以全新的自然語言完成交互,通過數字人的聯動系統和數字化的監控大屏,實現全新的業務交互。

    數字人在 NLP(自然語言處理)和 NLU(自然語言理解)的基礎上定義了路網運行監測,應急救援管理,包括協同服務管理、仿真決策和大屏等 62 項指令集。通過指令集實現極簡交互、高效的協同,實現跨系統、跨功能、跨 API、跨數據的打通,有效提升業務效率

    2)毫末智行 DriveGPT: 首個將 GPT 技術用于自動駕駛領域的公司

    在自動駕駛領域,目前明確提出相關模型的是毫木智行的 DriveGPT。

    毫末智行是長城汽車投資的自動駕駛公司。毫末智行的前身是長城汽車的智能駕駛前瞻部,于 2019 年從長城汽車獨立。長城汽車技術副總工程師、長城汽車智能駕駛系統開發部部長張凱擔任董事長,前百度智能汽車事業部總經理顧維灝 2021 年加入,并擔任 CEO。

    2023 年 1 月,毫末在對 Transformer 大模型前沿探索的基礎上,率先同時推出了視覺自監督大模型、3D 重建大模型、多模態互監督大模型、動態環境大模型、人駕無監督認知大模型等五個自動駕駛大模型,成為行業首個將 GPT 大模型技術引用到自動駕駛認知決策當中的自動駕駛公司。

    DriveGPT 的底層模型與 ChatGPT 一樣,都采用了生成式預訓練模型架構,使用了大規模無監督的數據進行初始模型的生成,也都采用了 Prompt 微調方式和 RLHF 人類反饋強化學習的方式進行模型效果的優化;二者的不同之處在于ChatGPT 輸入輸出的是自然語言的文本,而 DriveGPT 輸入輸出的分別是融合感知場景序列和生成的預測場景序列,雙方應用的場景不同,ChatGPT 主要用于自然語言處理領域,而 DriveGPT 主要用于駕駛場景決策領域。

    在自動駕駛認知決策中,DriveGPT 通過引入駕駛數據,使用 RLHF(人類反饋強化學習)技術,對自動駕駛認知決策模型進行持續優化,同時毫末正在將感知能力融入到 DriveGPT 大模型訓練當中,形成一整套的端到端自動駕駛能力模型。DriveGPT 也將具備道路駕駛場景的理解和識別、道路駕駛場景的重建與生成,以及智能駕駛輔助、駕駛能力測評等能力。

    不過,毫末智行技術副總裁艾銳也表示,目前 DriveGPT 的應用,對于汽車算力的需求還是太大,還需要一定的時間才能解決。同時在算力提升后,對汽車的能耗也會帶來不小的挑戰,未來需要找到一種低成本的兌現方式。從目前來看,這種能力只能部署在云端,讓大家通過聯網去使用。

    3)商湯日日新 SenseNova

    4 月 10 日,商湯科技 SenseTime 舉辦技術交流日活動,發布了“日日新 SenseNova”大模型體系,該體系可提供自然語言、內容生成、自動化數據標注、自定義模型訓練等多種大模型及能力,同時結合決策智能大模型,為 AGI 實現提供重要起點。

    5 月,商湯在賽文年會上首次全面介紹了對交通+大模型應用場景的理解,基于商湯日日新 SenseNova 大模型體系對交通產品體系進行探索和落地應用,認為“入口”、“AI 助手”、“知識庫”是大模型在交通管理領域應用的三大表現形式。

    4)拓維信息+華為盤古大模型

    在 7 月 8 日上午舉行的盤古大模型合作伙伴簽約儀式上,拓維信息(002261)與華為正式簽署合作協議,成為盤古大模型生態合作伙伴,基于盤古大模型開發交通行業大模型,共建大模型生態。

    據了解,拓維信息是華為云首批同舟共濟合作伙伴,也是華為“大模型+鯤鵬+昇騰 AI+開源鴻蒙”全方位戰略合作伙伴,該公司深耕行業數字化二十余年,在交通、教育領域積累了海量數據(603138)和較深的認知,而盤古大模型在交通行業的落地,離不開行業數據的支撐和對行業的深刻理解。

    拓維信息相關負責人介紹,接下來,其將進一步深化與盤古大模型在數據、算法以及服務等方面的交流與合作,加速推動交通行業大模型落地。

    7 月 26 日電,拓維信息在互動平臺表示,公司交通行業大模型目前還處于驗證和研發階段,公司將加速推進正式的應用。公司將基于盤古大模型開發交通行業大模型,主要解決交通領域智能場景的快速實現和準確率提升,包括但不限于道路治理、自由流收費、事件應急預警等。

    5)“通義千問”+千方科技“梧桐”行業大模型

    在商湯科技發布“日日新 SenseNoya”大模型的第二天,2023 年阿里云峰會在北京召開,峰會上發布了 AI 大模型“通義千問”。阿里巴巴集團董事會主席兼 CEO、阿里云智能集團 CEO 張勇在會上表示,阿里巴巴所有產品未來將接入“通義千問”大模型,進行全面升級改造。

    阿里云智能交通物流行業總經理張磊在賽文年會上表示:“阿里云具備研發生成大模型的關鍵要素,愿攜手客戶與伙伴共同探索大模型在交通物流行業的智能化應用。”

    4 月 26 日,2023 阿里云合作伙伴大會上,千方科技作為“千問伙伴計劃”首批唯一交通領域合作伙伴受邀參會,表示將與阿里云攜手推動大模型在交通行業落地應用,探索智慧交通更優解。作為首批唯一交通領域合作伙伴,與阿里云攜手推動大模型在交通行業落地應用,助力豐富應用場景,為交通基礎設施的數國冰合車字化、網聯化與智能化建設注入新動能。

    次月,千方科技旗下宇視科技發布宇視行業大模型“梧桐“并展示產品端第一階段的落地成果。這是繼加入“千問伙伴計劃”,宣布攜手阿里云共創交通大模型后,千方科技擁抱 AIGC 技術的又一重要落地。

    6)北京交通大學研發國內首個開源綜合交通大模型 TransGPT·致遠

    7 月 27 日,北京交通大學聯合中國計算機學會智慧交通分會與足智多模公司等正式開源了,自主研發的國內首個綜合交通大模型:TransGPT·致遠。(開源地址:https://github.com/DUOMO/TransGPT)。

    TransGPT 不僅可以用于學術研究,通過郵件申請并獲得官方許可后,可以免費商業化。(申請郵箱地址 duomo_tech@163.com)。

    據悉, TransGPT 主要致力于在真實交通行業中提供各種功能,包括交通情況預測、智能咨詢助手、公共交通服務、交通規劃設計、交通安全教育、協助管理、交通事故報告和分析、自動駕駛輔助系統等,例如,通過實時監測和分析車輛、道路、信號燈等信息。

    TransGPT 還可以為道路工程、橋梁工程、隧道工程、公路運輸、水路運輸、城市公共交通運輸、交通運輸經濟、交通運輸安全等行業,提供類ChatGPT 的小百軍問答服務,例如,肇事逃逸將面臨哪些處罰?

    訓練數據方面,TransGPT 致遠的訓練基于約 34.6 萬條交通領域文本數據(用于領域內預訓練)和 5.8 萬條交通領域對話數據。數據內容包括:科技文獻、統計數據、工程建設信息、管理決策信息和科學數據等。

    1)交通安全教育:交通大模型可以用于生成交通安全教育材料,如安全駕駛的建議、交通規則的解釋等。

    2)智能出行助手:在車輛中的智能助手可以使用大型交通大模型來理解和生成更自然、更復雜的對話,幫助駕駛者獲取路線信息、交通更新、天氣預報等。

    自動回答關于公共交通服務的問題,如車次、票價、路線等。這可以提高服務效率并提升乘客體驗。

    3)交通管理:通過實時監測和分析車輛、道路、信號燈等信息,協助智能協調交通流量,減少交通擁堵。分析社交媒體或新聞報道中的文本信息,預測交通流量、交通堵塞或事故的可能性。

    同時,該模型能分析交通事故歷史和特征,給出相應對策和方案,減少交通事故的發生。

    4)交通規劃:交通大模型可以幫助分析公眾對于交通規劃提案的反饋和意見,提供決策者更全面的信息。

    5)交通事故報告和分析:交通大模型可以幫助快速理解和分類交通事故報告,提供事故原因的初步分析。

    交通政策研究:大型交通大模型可以用于分析公眾對于交通政策的反饋,或者生成關于交通政策影響的報告。這可以幫助政策制定者更好地了解政策的實際效果。

    研發團隊在交通 benchmark 上進行了 zero-shot 評測,并獲得了不錯的成績。

    交通安全教育方面:生成交通安全教育材料,如安全駕駛的建議、交通規則的解釋等;

    交通情況預測方面分析社交媒體或新聞報道中的文本信息,預測交通流量、交通堵塞或事故的可能性;

    事故報告和分析方面:理解交通事故報告,提供事故原因的初步分析;

    交通規劃方面:分析公眾對于交通規劃提案的反饋和意見,提供決策者更全面的信息。

    多模態

    TransGPT 已經具備面向 BIM 模型審核員、智能運維、智能咨詢等場景的應用落地能力,將大幅度促進鐵路工程等數字化轉型和智能化提升。

    研發團隊表示,交通大模型采用了基于 Transformer 架構的文本大模型、多模態大模型與實時場景數據調用能力,整體上形成綜合交通大模型為基礎設施、輔以交通細分行業應用的架構。

    支持實時類應用,包括:駕車規劃、公共交通規劃、(逆)地理編碼查詢等落地場景應用能力,能夠促進鐵路交通等領域的數字化轉型和智能化提升。

    7 月 14 日,佳都科技集團、云從科技集團、重慶交通開投集團聯合發布知行城市交通行業大模型,并簽署戰略合作協議,三方將就深入開展城市交通技術研發及應用落地達成戰略合作。

    知行交通行業大模型將深耕交通行業,大模型可以實現對軌道車站客流、軌道站點與公交銜接、道路的擁堵治理等等問題進行人工智能深加工和科學管理,并加速大模型在產業價值的大規模應用。

    此外,在智能大交通方面,大模型垂直應用場景有四個階段:把人類掌握的知識注入行業大模型里面;利用大模型能力成為人機協同生產力助手;結合行業知識與專家經驗形成交通大模型,提質增效;將交通系統生產與管理變成若干個自動或由人監督的自動化運行系統。

    重慶交通開投科技公司總經理袁軼介紹,重慶交通開投集團扎實推進數字重慶建設,促進人工智能與實體經濟深度融合,攜手佳都科技集團、云從科技集團,通過以“知行交通大模型”為代表的 AI 人工智能與重慶交通運行數據進行結合,賦能重慶軌交、公交、高鐵、交通樞紐的數字大交通建設和運營,實現乘客服務、高效運營、應急聯動、智能運維等創新應用落地,為重慶交通行業提供智能化的解決方案和決策支持。

    此次佳都科技、云從科技、重慶交通開投集團合作,將為重慶智能軌道交通技術創新提供統一的數字化底座。各方將繼續開展基于智能交通大數據應用開發、智慧化運營、運維等方面的探索并產業化,加速在重慶軌道交通合作項目中落地推廣應用,真正實現數字化改革賦能軌道交通出行服務迭代升級。

    8)曠視科技智駕產品

    從 2021 年初大力研發智駕方案到宣布推出量產方案,曠視用時不到三年。

    2023年6月中旬,在加拿大舉力的 AI 頂會 CVPR2023 上,曠視科技獲得自動駕駛國際挑戰 OpenLane 拓撲關系賽道第名。CVPR2023 自動駕駛國際挑戰賽分為四個賽道,包括、OnlineHDMapConstruction(在線高精地圖構建)賽道等。

    “OpenLane 拓撲關系挑戰賽,本質上是一個通過實時感知來生成地圖的比賽。目前大家對道路拓撲結構(如車道線、車速標識等)的感知,主要是靠高精地圖來提供,而要去高精地圖的話,那就只能把這些東西感知之后,再構建自己的道路拓撲結構。”曠視科技智駕業務總裁劉偉對雷峰網解釋說,“這個比賽的現實意義在于,可以讓曠視在‘去高精地圖’這條路上越走越扎實,最終在城區也能實現‘去高精地圖’。 ”憑借在這一賽事上的出色表現,一向“神秘”的曠視自動駕駛業務逐漸浮出水面。

    簡單來說,曠視的產品分為三個配置:標準版、專業版、旗艦版,分別對應 10-15 萬元車型、15-30 萬元車型和 30 萬元車型。其中標準版方案具備高速 NOP 功能,專業版方案具有城市 NOP 功能,最高配置的旗艦版方案則具備增強的城市 NOP 功能以及更強的安全冗余。

    當下曠視智駕業務的發力點則主要在標準版和專業版方案。“我們瞄準的是量產市場,曠視希望做到在中低價位車型中達到一年幾百萬輛的銷量,這兩個版本的方案都是不帶激光雷達的,成本相對較低,可以服務于 10 萬 -30 萬元的車型。”劉偉表示。

    8、總結

    目前,中美在 AI 大模型方向領先世界各國,然而二者的競爭也已經明牌,中美兩國在 AI 大模型各方面的表現各有勝負,其中以谷歌為代表的科技巨頭長期投身于基礎理論的研究,使得美國引領者人工智能的發展潮流,依托濃厚的工程師文化,美國在基礎大模型上保持領先優勢。在一級市場上,美國對大模型的投資也比較積極,其中以英偉達、微軟、Salesforce 等為代表的科技巨頭成為美國 AI 領域最重要的“獨角獸獵手”,在一級市場的大手筆投入,為美國人工智能的發展積蓄了力量。

    此外,美國各個行業整體的信息化水平較高,積累了豐富的結構化數據,這為美國做大模型落地打下了基礎。

    因此,本報告認為,美國在 AI 大模型發展的基礎理論與基礎數據方面,有著獨特的優勢,這也為 AI 大模型的使用打下了基礎,尤其是在醫療研發等方向其會繼續保持著先發優勢。

    相比美國,國內一直扮演著追隨者的角色,在基礎模型方面,中美之間的差距并不大,“重應用輕基礎”的研發理念,以及國內龐大的下游需求,讓國內機構更加專注于落地應用的研究,可以說,在 AI 大模型的應用上,國內是更勝一籌的。

    一方面是,國內一級市場更多是關于大模型應用的創業項目,另一方面,各行業較成熟的企業,例如教育行業的好未來,辦公軟件行業的金山辦公,醫療行業的醫云科技等等,均依托在各自行業的深耕,或外接基礎模型,或利用開源模型自研模型來使所從事的行業用上 AI 大模型。

    不過,也應該注意到,國內不少行業尚未完成信息化,基礎數據的匱乏使得 AI 大模型在某些行業寸步難行,此外,算力制約成為中美 AI 競爭的一把利刃,努力沖破算力制約是 AI 發展路上的頭等大事。

    中美 AI 競爭的過程中,優劣明顯,但相比美國在應用上所處的下風,我國在算力及數據等 AI 發展基礎要素上的短板更值得注意。

    來源:鈦媒體

    備案號:贛ICP備2022005379號
    華網(http://www.668528.com) 版權所有未經同意不得復制或鏡像

    QQ:51985809郵箱:51985809@qq.com

    主站蜘蛛池模板: 美女免费网站xx美女女女女女女bbbbbb毛片 | 狂野欧美性猛交xxxx| 国产一卡二卡≡卡四卡无人| 69成人免费视频| 在线精品免费视频无码的| 三年片免费观看大全国语| 日韩在线一区二区三区| 亚洲国产欧美在线观看| 特黄特色大片免费播放器999| 另类国产ts人妖系列| 野花社区视频在线观看| 国产欧美久久久精品影院| 91精品免费看| 天天爱天天做天天爽| 三级国产三级在线| 无码日韩精品一区二区三区免费| 久久精品视频免费播放| 欧美一级片手机在线观看| 亚洲第一成年免费网站| 男同精品视频免费观看网站| 又爽又黄又无遮挡的视频在线观看 | 亚洲精品视频观看| 精品一区二区三区四区电影| 国产freesexvideos性中国| 韩国三级大全久久网站| 国产欧美一区二区精品久久久| 67pao强力打造国产免费| 在线观看亚洲av每日更新| jazzjazz国产精品| 少妇饥渴XXHD麻豆XXHD骆驼| 中文字幕在线观看你懂的| 日本人强jizzjizz老| 五月天婷婷精品视频| 欧美亚洲桃花综合| 亚洲国产日韩欧美一区二区三区| 欧美黑人bbbbbbbbb| 亚洲综合综合在线| 猛男狂搡美女免费| 免费中文字幕在线观看| 精品久久久无码中字| 午夜成人免费视频|