網站串接「Gemini Embedding」語意模型打造下一代AI智能網站

網站串接「Gemini Embedding」語意模型打造下一代AI智能網站!

 

由 Google 推出的 Gemini Embedding 語意模型,正引領一場超越傳統關鍵字搜尋的技術革命。本文將對比語意理解與傳統檢索的差異,並全面介紹 Gemini Embedding 模型。透過將其串接至網站,您將能賦予網頁真正的語意理解能力,全面進化為新型態的智慧網站。

Gemini Embedding語意模型是什麼?

 Gemini Embedding語意模型由Google開發,第一代 (gemini-embedding-001)模型2025 年 7 月 14 日正式全面開放(GA)給開發者使用,他可以用於比對使用者輸入的文字, 找出最相近於此語意的文字,將之比對出來,例如當使用者輸入「小狗」,語意模型會將相關的字詞比對出來,例如: 「小狗 = 汪星人 = 寵物犬 = 黃金獵犬」,即使網頁完全沒有使用者輸入的字眼,也能精準命中概念相同的結果。而最新第二代 (Gemini Embedding 2)模型2026 年 4 月 22 日正式全面開放(GA),他除了比對文字,還能可直接整合文字、圖片、影片和音訊,達成更完整的比對以及拆解。

 Google Gemini 語意模型內建支援超過 100 種語言的語意識別,也具備強大的跨語言檢索能力,因此是當今名列前茅的語意比對模型。

 目前此語言模型有免費版本,但若要串接到網站,則建議使用付費版本,在付費模式下,Google 承諾將排除網站使用數據,不納入其模型訓練與分析中,全面保障企業資產與隱私安全。

Gemini Embedding語意模型和傳統的關鍵字搜尋有何不同?

1. 傳統關鍵字檢索:基於字面匹配的精準查詢

關鍵字檢索是最傳統、也是目前仍廣泛使用的檢索方式,其核心概念是字面匹配。

以致茂官網產品搜尋為例,當在關鍵字輸入62000D,系統會掃描資料庫中的產品標題,在技術上主要透過SQL查詢加入條件透過 AND、OR、NOT 等條件組合並搜尋產品標題,或透過 LIKE '%26001%' 等 SQL 語法進行模糊比對,找出標題內含有該型號的相關產品。搜尋結果如下圖所示。


優點: 此傳統關鍵字搜尋適合用於專業產品或文件檢索,會很精準的搜尋產品。

缺點: 一旦使用者輸入的詞彙遭遇同義詞或語序變化,系統就會因字面不符而漏失關鍵結果。若今天想要搜尋時,更擴大於希望相同語意的輸入都可以被找尋到,那麼就需要使用語意檢索模型。

2.語意檢索模型:跨越字面藩籬的智慧理解

語意檢索則是利用向量化(Embedding)技術,將文字轉換成多維度向量,並透過相似度(通常是餘弦相似度)計算內容的相關性。簡單來說,在這種架構下,即使字面不同,只要意思相近,系統就能準確捕捉。

實例一:擺脫地域與字面限制

傳統搜尋中,「新北網頁設計」與「北台灣架設網站」因字面差異大而難以相通;但在語意模型分析下,兩者的向量位置會非常接近。

實例二:專業產品搜尋意圖擴充

當使用者輸入「車用電池測試」,但產品標題為「EV Battery Test」或「鋰電池組充放電測試系統」。
•    傳統關鍵字搜尋:因網站產品標題僅寫「EV Battery Test」或「鋰電池組充放電測試系統」,會因找不到使用者輸入的「車用」二字而無法搜尋到。
•    語意檢索:語意模型理解「車用」與「EV / 電動車」高度相關,且「測試」與「充放電、壽命模擬」的意義相近,因此能推薦該產品。

網站實際FAQ 應用情境:詞彙轉化為意圖概念

假設網站的 FAQ 單元中,有一篇文章標題為:「做一個網站要花多久時間?」。當使用者輸入:「網站架設時程?」 時,Gemini 語意模型會進行以下拆解與映射:
1.    「做一個網站」-> 映射至 網站開發 / 網站架設 的概念。
2.    「花多久時間」-> 映射至 時程 / 工期 / 時間成本 的概念。
藉由這種意圖辨識,模型會判定兩者具備高度相同的查詢意圖,從而將最正確的解答呈現給使用者。因此,透過透過語意檢索的全面優化,網站將從被動的「資料庫篩選」,轉變為智慧的搜尋,為每一位客戶帶來更流暢、更友善的網站體驗

Gemini Embedding語意模型可以串接到網站嗎?

Gemini Embedding 語意模型可以串接到網站!

在Gemini API 官網上,有詳細列出此兩個語言模型的詳細資料如下:

➤Gemini-embedding-001模型詳細資訊

➤Gemini-embedding 2模型詳細資訊


 若要串接Gemini-embedding的API 費用,則是根據使用量來計算的,通常以處理的 token 數量定價token 是 AI 模型理解資訊的「最小計算單位」,不同類型的媒介轉換方式如下:

  • 中文字: 1 個中文字大約等於 1.5 到 2 個 Token。
  • 英文字: 100 個英文單字大約等於 60 到 80 個 Token。
  • 多媒體(圖片/影片/音訊): 系統會根據圖片解析度、影片與音訊的長度,自動將其編碼並折算為對應的 Token 數量。

網站使用 Gemini Embedding 語意模型時,費用主要產生在以下兩個時間點:

  • 第一階段:網站初始化 / 上架新內容

          網頁文章或商品資料 ➔ 轉換為 Token ➔ 產出向量 ➔ 存入向量資料庫 (初期費用集中)

  • 第二階段:使用者前台搜尋 

          使用者輸入搜尋詞 ➔ 轉換為 Token ➔ 產出向量 ➔ 資料庫比對相似度 (單次費用極低、高頻率)

根據官方最新的 Gemini Developer API 的付費方案(Pay-as-you-go)是採用 「輸入百萬 Token (Per 1M Input Tokens)」 的方式來計費:

模型版本 輸入媒介類型 每 100 萬 Input Tokens 費用 (美金)
gemini-embedding-001 純文字 $0.15 USD (約合台幣 $4.8 元)
gemini-embedding-2 多模態
(文字/圖片/影片/音訊)
$0.20 USD (約合台幣 $6.4 元)
(圖片另計:每張約 $0.000105 USD)

若以製作網站FAQ,而使用者輸入為以下內容: 

  • 輸入內容做一個響應式網站大概需要花多少時間?(約 18 個字)
  • 消耗 Tokens:每次搜尋約消耗 30~40 Tokens
  • 100 萬 Tokens 可搜尋次數:約是25000次。

詳細價格可以參考Gemini 的 API 費用介紹,目前官網上有三個方案可供使用,以下圖示說明:

若為測試用開發者,可使用免費版本。若為企業官網串接,建議使用第二種付費方案在付費模式下,使用了批次API模式,Google 承諾將排除網站使用數據,不納入其模型訓練與分析中,全面保障企業資產與隱私安全。

  天矽科技擁有 30 年的專業大型網站的建置經驗,也有充足的串接ERP/API實力,在2026年我們將 AI 智慧對話服務完美導入實戰,成功幫助客戶的網站使用者體驗大幅升級,讓使用者有像使用Google AI模式的體驗!從 LLM 大型語言模型到各類先進AI 模型,天矽科技具備頂尖的串接API與整合實力。想用 AI 翻轉你的網站影響力嗎?歡迎立刻諮詢天矽科技,讓我們為你量身打造 AI 智慧新網頁!

share FB LINE
看天矽作品集 回上一頁
真人線上客服