AI 術語表
智慧代理/代理性(agent, agentic):能夠執行任務(通常是自主執行)的 AI 稱為「代理」,而「代理性」則是這類軟體的統稱。AI 代理可以調動不同的系統來完成工作,例如:讀取您備忘錄裡的購物清單,然後使用其他應用程式進行下單並付款。
AI 倫理(AI ethics):旨在防止 AI 傷害人類的原則,透過確定 AI 系統應該如何收集數據或處理偏見等方法來實現。
AI 精神錯亂(AI psychosis):一種非臨床診斷的現象,指個人對 AI 聊天機器人過度迷戀、著迷或自我膨脹,導致產生誇大妄想、深層的情感連結,並與現實脫節。
AI 安全(AI safety):一個關注 AI 長期影響的跨學科領域,研究 AI 如何可能突然進步到對人類抱持敵意的超級智慧。
演算法(algorithm):允許電腦程式以特定方式分析數據(例如識別模式)的一系列指令,進而完成排序結果或提供建議等任務。
對齊(alignment):微調 AI 以更好地產生預期結果。這可以指從內容審查到與人類保持積極互動的任何調整。
擬人化(anthropomorphism):人類將人類特徵賦予無生命物體的現象。在 AI 領域中,這包括相信聊天機器人擁有情感或具備意識,並將其當作朋友或治療師來對話。
通用人工智慧(artificial general intelligence, AGI):一種設想中比我們今天所知更先進的 AI 概念,能夠執行通常需要人類智慧的廣泛任務。
偏見(bias):AI 系統中的一種現象,指系統產生的結果不公平地偏袒某個群體或偏向某種結果。這通常是因為用來訓練 AI 的數據本身就包含人類的偏見,或是開發者的設計不夠全面。
大數據(Big Data):指體積極其龐大、複雜且生成速度極快的數據集。傳統的數據處理軟體無法處理這些數據,但它們是訓練現代 AI 模型必不可少的燃料。
黑盒子(black box):指一個我們知道輸入什麼、也知道輸出什麼,但卻無法確切得知其內部如何運作或如何做出決策的 AI 系統。這在深度學習中非常常見,也引發了透明度與責任歸屬的疑慮。
聊天機器人(chatbot):一種旨在透過文字或語音與人類進行模擬對話的電腦程式。現代聊天機器人(如 ChatGPT、Gemini 等)多基於大型語言模型,能表現出極高的理解力。
權利宣告/標爪(claw):這是近期出現的法律與內容保護術語。指創作者、新聞機構或內容網站明確在數位內容或代碼中加入限制,禁止 AI 公司在未經授權的情況下抓取或使用其數據進行模型訓練。
計算能力/算力(compute):指運行 AI 模型、處理大數據和訓練網絡所需的電腦處理資源(如 GPU、TPU 等硬體基礎設施)。
上下文視窗(context window):指 AI 模型在處理特定請求(Prompt)時,能夠同時「記住」並考慮的最大文本量或訊息範圍。上下文視窗越大,AI 越能理解超長篇的文章或複雜的歷史對話。
版權侵害(copyright infringement):在 AI 領域中,這指未經許可便將受版權保護的書籍、藝術品、音樂或文章,直接投入 AI 模型的訓練數據集中,目前全球多國正為此進行密集的法律訴訟。
資料中心(data center):用來容納大量伺服器、儲存系統和算力硬體的實體設施。隨著生成式 AI 爆發,這類設施因驚人的耗電量和冷卻水需求而備受環保關注。
深度偽造(deepfake):一種利用人工智慧(特別是深度學習)將現有的圖像、音訊或影片,替換成另一個人面孔或聲音的技術,常用於製造高度逼真的虛假影音。
深度學習(deep learning):機器學習的一個分支,模仿人類大腦神經元的結構。它利用多層的「人工神經網路」來處理數據,是語音識別、影像辨識和生成式 AI 的技術核心。
擴散模型(diffusion model):一種主要用於生成圖像和影片的機器學習模型。其原理是先將圖像逐步加入噪點(破壞圖像),再訓練 AI 學會如何將噪點一步步清除,從而從無到有「還原」出一張全新且高品質的圖片。
具身智慧(embodied AI):指將人工智慧大腦放入能夠與實體世界互動的物理身體中,例如人形機器人、無人機或自動駕駛汽車。
新興行為/湧現能力(emergent behavior):指 AI 模型在規模達到一定程度後,突然展現出開發者未曾刻意訓練、也無法預測的全新能力(例如突然學會解答某種邏輯謎題或寫代碼)。
生成式人工智慧(generative AI):人工智慧的一個類別,專注於創造全新的內容。它可以根據使用者的提示詞,生成文字、圖像、程式碼、音樂甚至是影片。
幻覺(hallucination):指 AI 模型(特別是大型語言模型)非常自信地輸出完全錯誤、虛構或不符合事實的資訊的現象。
大型語言模型(large language model, LLM):一種經過海量文本數據訓練的 AI 模型,能夠理解、生成、翻譯並預測人類語言。
機器學習(machine learning):人工智慧的核心領域,指電腦系統不依賴人類逐字編寫固定程式碼,而是透過分析數據和演算法自動「學會」如何執行特定任務並改善準確率。
多模態(multimodal):指 AI 模型能夠同時處理和理解多種不同類型(模態)的輸入與輸出,例如同時看懂圖片、聽懂語音並讀懂文字。
神經網路(neural network):一種模仿人類大腦結構的硬體或軟體系統,由互相連結的節點(人工神經元)組成,用來識別複雜數據中的模式。
提示詞(prompt):使用者輸入給 AI 系統的文字指令、問題或圖片,用來引導 AI 產生特定的回答或成果。
提示詞工程(prompt engineering):一種新興的技術或技能,指透過精心設計、調整提示詞的結構與用字,來引導 AI 產出最高品質、最精準的答覆。
檢索增強生成(retrieval-augmented generation, RAG):一種優化 AI 輸出的技術。它讓大型語言模型在回答問題前,先去外部的可信資料庫(如企業內部文件或即時搜尋引擎)搜尋最新資訊,再整合這些資料寫出回答,能大幅減少「幻覺」。
感官知覺/意識(sentience):感受、知覺或體驗主觀意識的能力。目前主流科學界一致認為,現今的 AI 聊天機器人即使看起來再聰明,也完全不具備真正的意識或情感。
AI 垃圾內容(slop):一個近年流行的新詞。專指由生成式 AI 批量製造、品質低劣且未經人類審查的文字、圖片或網頁,它們正在充斥網路,嚴重破壞搜尋引擎與社群媒體的體驗。
監督式學習(supervised learning):機器學習的一種方法。訓練時,人類會提供 AI「帶有標準答案(標籤)」的數據,讓 AI 從中學習輸入與輸出之間的對應關係(例如:給一萬張標註著『貓』的圖片來讓 AI 學會認貓)。
權重(weights):AI 神經網路內部的一些數值引數。模型在訓練過程中會不斷調整這些數值,藉此決定不同輸入訊息的重要程度,這直接影響了 AI 最終的決策與輸出。
非監督式學習(unsupervised learning):機器學習的一種方法。訓練時,數據不帶有任何標籤或正確答案,AI 必須自己去尋找數據中隱藏的結構、規律或進行群組分類。
代幣/標記(tokens):AI 處理文本的基本單位。一個 token 可以是一個字、一個字母甚至是一個中文字的一部分。AI 在閱讀或生成文本時,都是將文字切碎成 tokens 來進行數學計算,這也是 AI 服務計費的常見標準。
沒有留言:
張貼留言