大模型

加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

局部模型 為了仿照實(shí)體而去建造的大型道具模型,或局部道具模型。

局部模型 為了仿照實(shí)體而去建造的大型道具模型,或局部道具模型。收起

查看更多
  • 智能體綜述:起源、演進(jìn)與大模型時(shí)代的新內(nèi)涵
    【AI先鋒洞察】近兩年隨著大模型能力的不斷躍升,“智能體”越來越多進(jìn)入到公眾視野,成為學(xué)者、程序員、投資人爭相關(guān)注的話題和對象。年初Manus團(tuán)隊(duì)發(fā)布的智能體應(yīng)用案例著實(shí)讓人感到,智能體不再是學(xué)術(shù)概念,而已經(jīng)走入到人們的工作生活,用戶只需通過自然語言描述需求,智能體即可快速響應(yīng)并執(zhí)行任務(wù)。然而智能體究竟是什么,不同時(shí)代、不同人群和不同角度都有著不同的定義。本文嘗試做一個(gè)相對客觀的綜述,并著重闡述大
    169
    2小時(shí)前
    智能體綜述:起源、演進(jìn)與大模型時(shí)代的新內(nèi)涵
  • 在英偉達(dá)Thor-X上測試VLM自動(dòng)駕駛大模型運(yùn)行,延遲會(huì)是多少毫秒?
    英偉達(dá)結(jié)合自己開發(fā)的VLM模型,并基于Thor-X平臺(tái)做了延遲測試,并于2025年6月9日公開發(fā)表了測試結(jié)果,詳情可見論文《LiteVLM: A Low-Latency Vision-Language Model Inference Pipeline for Resource-Constrained Environments》。 ? 英偉達(dá)LiteVLM管線 圖片來源:英偉達(dá) &nbsp
  • 大模型退火之后,AI手機(jī)還好嗎
    回顧2022年至2023年,由ChatGPT問世點(diǎn)燃的生成式AI浪潮,迅速席卷了整個(gè)科技行業(yè),智能手機(jī)也不例外。一時(shí)間,各大手機(jī)廠商仿佛陷入了一場關(guān)于自研大模型的軍備競賽。
    大模型退火之后,AI手機(jī)還好嗎
  • 蘋果被硅谷AI圈圍毆了!
    大模型評估體系崩塌?蘋果之外,UC伯克利、Salesforce連環(huán)論文狙擊。
    351
    06/23 14:46
    蘋果被硅谷AI圈圍毆了!
  • 揭秘大模型的魔法:從嵌入向量說起
    本文將以Transformer架構(gòu)為核心,深入探討嵌入向量的生成過程,剖析其背后的“魔法”,并通過代碼示例展示如何實(shí)現(xiàn)這一過程。
    揭秘大模型的魔法:從嵌入向量說起
  • 大模型“六小虎”第二個(gè)IPO,近了!
    曝MiniMax擬香港上市,估值超210億元。6月18日消息,據(jù)外媒報(bào)道,國內(nèi)大模型“六小龍”之一、上海大模型獨(dú)角獸MiniMax(稀宇科技)計(jì)劃赴港IPO,最早可能在今年進(jìn)行。目前MiniMax估值約30億美元(約合人民幣216億)。知情人士稱,MiniMax已經(jīng)為IPO聘請了財(cái)務(wù)顧問,但相關(guān)討論仍在進(jìn)行中,估值和時(shí)機(jī)等細(xì)節(jié)可能會(huì)發(fā)生變化。
    270
    06/19 08:47
    大模型“六小虎”第二個(gè)IPO,近了!
  • 大模型推理PD分離技術(shù):核心原理、技術(shù)優(yōu)勢、挑戰(zhàn)與未來展望
    本文將全面分析PD分離技術(shù)的核心原理、系統(tǒng)實(shí)現(xiàn)、性能優(yōu)勢、現(xiàn)存挑戰(zhàn)以及未來發(fā)展方向,幫助讀者深入理解這一變革性技術(shù)及其對AI基礎(chǔ)設(shè)施的影響。
    大模型推理PD分離技術(shù):核心原理、技術(shù)優(yōu)勢、挑戰(zhàn)與未來展望
  • 工業(yè)大模型的這三點(diǎn)變化,正悄然改變制造業(yè)
    屏幕上,一行行圖文快速刷新,在一問一答間,復(fù)雜的電氣行業(yè)難題便迎刃而解;車間里,只需在電腦上稍作設(shè)置,工業(yè)機(jī)器人便自動(dòng)完成復(fù)雜繁重的工作;辦公室內(nèi),只需導(dǎo)入?yún)?shù)文件,準(zhǔn)確、合規(guī)、定制化的PCB圖紙便立等可取……當(dāng)前,人工智能,尤其是大模型的應(yīng)用已經(jīng)深入工業(yè)制造的每一個(gè)環(huán)節(jié)中。
    工業(yè)大模型的這三點(diǎn)變化,正悄然改變制造業(yè)
  • 大模型“內(nèi)卷”,打不過就加入——開發(fā)者從哪做起?
    與其去參與大模型的“內(nèi)卷”,不如去做大模型應(yīng)用開發(fā),因?yàn)榇竽P鸵话阋蛻?yīng)用結(jié)合才能在各種場景落地,所以加入大模型應(yīng)用開發(fā)賽道,可能是個(gè)人提升自我的有效途徑。
  • 與GPU共生進(jìn)化,Supermicro液冷革命進(jìn)入2.0時(shí)代
    當(dāng)NVIDIA B200 GPU將單芯片算力推至20PetaFLOPS時(shí),數(shù)據(jù)中心的液冷革命也在如火如荼的進(jìn)行中。Supermicro作為全球AI服務(wù)器龍頭,其液冷方案迭代已與GPU性能形成了共生進(jìn)化。這也揭示了數(shù)據(jù)中心未來發(fā)展的方向——AI算力革命的上半場拼芯片性能,下半場則更注重能源效率。
    2093
    05/26 12:35
  • 她如何把“系統(tǒng)2”帶給了大模型 |對話微軟亞洲研究院張麗
    2023年,業(yè)界還在卷Scaling Law,不斷突破參數(shù)規(guī)模和數(shù)據(jù)規(guī)模時(shí),微軟亞洲研究院張麗團(tuán)隊(duì)就選擇了另一條路徑。早在OpenAI o1發(fā)布前,張麗團(tuán)隊(duì)就開始探索大模型深度推理能力。System2這個(gè)原屬認(rèn)知科學(xué)的詞匯最早由她及團(tuán)隊(duì)引入大模型領(lǐng)域。最近,她們通過蒙特卡洛搜索算法讓7B模型實(shí)現(xiàn)了o1級別的數(shù)學(xué)推理能力。
    751
    05/26 11:15
    她如何把“系統(tǒng)2”帶給了大模型 |對話微軟亞洲研究院張麗
  • Claude 4空降!AI編程真神登場,連續(xù)7小時(shí)自主編程,寫代碼效率拉滿
    Claude 4深夜發(fā)布,編程助手同步開放。5月23日報(bào)道,今天凌晨,美國大模型獨(dú)角獸Anthropic在其首屆開發(fā)者大會(huì)上正式發(fā)布了下一代Claude模型:Claude Opus 4和Claude Sonnet 4,這也是Claude自2024年6月以來的首次大版本號更新。Anthropic將Claude Opus 4稱之為“世界上最好的編程模型”,能在復(fù)雜、長時(shí)間運(yùn)行的任務(wù)和智能體工作流中表現(xiàn)出穩(wěn)定的性能。Claude Sonnet 4是Claude Sonnet 3.7的重大升級,以編程和推理能力為核心,同時(shí)能更精確地響應(yīng)用戶提示詞。
    Claude 4空降!AI編程真神登場,連續(xù)7小時(shí)自主編程,寫代碼效率拉滿
  • 小芯片上的大模型
    “給我生成一份審訊盜竊案件的筆錄提綱?!敝噶钶斎牍P記本電腦之后,DeepSeek 16B(160億參數(shù)版)在毫秒間生成了一份包含基本信息、案件概述、權(quán)利告知、事實(shí)調(diào)查、其他重點(diǎn)事項(xiàng)、筆錄確認(rèn)、注意事項(xiàng)等一級標(biāo)題,且每個(gè)一級標(biāo)題都包含3-5個(gè)二級標(biāo)題的筆錄提綱。這是記者在第12屆中國國際警用裝備博覽會(huì)的中星微展臺(tái)看到的一幕。
    小芯片上的大模型
  • 據(jù)說DeepSeek的數(shù)據(jù)比別家的好? 為什么說數(shù)據(jù)質(zhì)量是大模型的關(guān)鍵變量?
    為什么有些大模型效果更自然、理解更準(zhǔn)、生成更穩(wěn)?參數(shù)量或架構(gòu)當(dāng)然重要,但在頂尖選手中,真正拉開差距的,往往是“看不見”的東西——比如數(shù)據(jù)質(zhì)量。
    據(jù)說DeepSeek的數(shù)據(jù)比別家的好? 為什么說數(shù)據(jù)質(zhì)量是大模型的關(guān)鍵變量?
  • 【一文看懂】什么是RAG:讓大模型不再死記硬背,而是學(xué)會(huì)“查了資料再回答”
    隨著大語言模型(LLM)在各個(gè)行業(yè)的廣泛應(yīng)用,我們不斷面對一個(gè)挑戰(zhàn):如何確保語言模型的回答不僅僅依賴于它的訓(xùn)練數(shù)據(jù),還能靈活地訪問外部的、最新的知識(shí)庫。檢索增強(qiáng)生成(Retrieval-Augmented Generation,簡稱RAG)正是為了解決這個(gè)問題而應(yīng)運(yùn)而生的技術(shù)架構(gòu)。本文將詳細(xì)介紹RAG的核心定義、技術(shù)框架、應(yīng)用場景、與相似技術(shù)的區(qū)別,以及它如何為AI系統(tǒng)帶來更高效、更智能的答案生成能力。
    1903
    05/08 15:50
    【一文看懂】什么是RAG:讓大模型不再死記硬背,而是學(xué)會(huì)“查了資料再回答”
  • Bye,英偉達(dá)!華為NPU,跑出了準(zhǔn)萬億參數(shù)大模型
    現(xiàn)在,跑準(zhǔn)萬億參數(shù)的大模型,可以徹底跟英偉達(dá)Say Goodbye了。完成此舉的,正是華為!要知道,在此之前,訓(xùn)練萬億參數(shù)大模型這事,是有諸多“攔路虎”在身上的。例如負(fù)載均衡難、通信開銷大、訓(xùn)練效率低等等。
    1058
    05/08 15:00
    Bye,英偉達(dá)!華為NPU,跑出了準(zhǔn)萬億參數(shù)大模型
  • AI芯片“功耗懸崖”:大模型催生的冷卻技術(shù)革命
    AI芯片的功耗和發(fā)熱量直接影響著企業(yè)的成本、風(fēng)險(xiǎn)以及芯片的穩(wěn)定性和壽命。如果芯片因過熱或短路而頻繁出現(xiàn)問題,那么AI的訓(xùn)練和推理效果及效率也會(huì)受到嚴(yán)重影響。冷卻技術(shù)革命,顯得十分急需。
    AI芯片“功耗懸崖”:大模型催生的冷卻技術(shù)革命
  • 大模型時(shí)代的智能營銷,從“玩具”到“工具箱”
    4月25日,百度Create大會(huì)上,百度創(chuàng)始人、董事長兼CEO李彥宏認(rèn)為,應(yīng)用與芯片、模型等基建之間的相互作用關(guān)系。尤其是AI技術(shù)與智能營銷工具之間,通用大模型在缺乏應(yīng)用場景中的對話更像是“玩具”,而在大模型驅(qū)動(dòng)下的諸多智能營銷工具才是真正產(chǎn)生價(jià)值的環(huán)節(jié)。最早實(shí)現(xiàn)AI落地應(yīng)用場景的智能客服,經(jīng)歷大小廠商推陳出新的產(chǎn)品之下,走得最為深入。
    大模型時(shí)代的智能營銷,從“玩具”到“工具箱”
  • 讓大模型和醫(yī)生搭檔,螞蟻AI醫(yī)療的「少數(shù)派」之路
    一家三甲醫(yī)院頂級??坪鸵患掖髲S,擁抱AI醫(yī)療的決心。“DeepSeek 一上線,行業(yè)有個(gè)聲音是醫(yī)生以后可能就沒飯吃了?!苯谠谝粓龉_活動(dòng)中,上海交通大學(xué)醫(yī)學(xué)院附屬仁濟(jì)醫(yī)院(下簡稱“仁濟(jì)醫(yī)院”)副院長、泌尿科學(xué)科帶頭人薛蔚說道。這番話的另一面,是傳統(tǒng)醫(yī)療機(jī)構(gòu)對新一代AI技術(shù)的價(jià)值重估。2025 年開年,DeepSeek掀起了大模型領(lǐng)域的新走向,將行業(yè)落地的算力、算法門檻都大幅降低,使得AI與產(chǎn)業(yè)融合開始爆發(fā),醫(yī)療就是其中的熱門場景之一。
    讓大模型和醫(yī)生搭檔,螞蟻AI醫(yī)療的「少數(shù)派」之路
  • 揭秘大模型的魔法:訓(xùn)練你的tokenizer
    大家好,我是寫代碼的中年人。在這個(gè)人人談?wù)摗癟oken量”、“百萬上下文”、“按Token計(jì)費(fèi)”的AI時(shí)代,“Tokenizer(分詞器)”這個(gè)詞頻頻出現(xiàn)在開發(fā)者和研究者的視野中。它是連接自然語言與神經(jīng)網(wǎng)絡(luò)之間的一座橋梁,是大模型運(yùn)行邏輯中至關(guān)重要的一環(huán)。很多時(shí)候,你以為自己在和大模型對話,其實(shí)你和它聊的是一堆Token。
    揭秘大模型的魔法:訓(xùn)練你的tokenizer

正在努力加載...