做AI方向的設(shè)計(jì),先了解這8個(gè)基礎(chǔ)技術(shù)要點(diǎn)!

AI 除了作為工具增進(jìn)我們的設(shè)計(jì)效率和質(zhì)量外,也成為了許多產(chǎn)品設(shè)計(jì)增強(qiáng)自己競爭力,許多新解決方案應(yīng)運(yùn)而生的一種機(jī)會。

作為設(shè)計(jì)師,我們也需要根據(jù)自己負(fù)責(zé)的產(chǎn)品范圍了解一些基礎(chǔ)的技術(shù)點(diǎn),才能更好的設(shè)計(jì)出能夠被用戶理解的好產(chǎn)品,所以我會分享一些 AI 產(chǎn)品中常見的技術(shù)知識點(diǎn)。

更多基礎(chǔ)干貨:

一、智能體(Agent)

智能體最近聊得比較多,它是一種能感知環(huán)境(通過傳感器或數(shù)據(jù)輸入)、自主決策(基于預(yù)設(shè)規(guī)則或機(jī)器學(xué)習(xí)模型)、并執(zhí)行行動(dòng)(如語音反饋、機(jī)械操作)的智能實(shí)體。其核心架構(gòu)包括感知模塊(Perception)、推理引擎(Reasoning Engine)和執(zhí)行器(Actuator)。例如,自動(dòng)駕駛汽車的智能體通過攝像頭感知路況,用深度強(qiáng)化學(xué)習(xí)模型規(guī)劃路徑,再控制方向盤執(zhí)行轉(zhuǎn)向。

二、Copilot(智能副駕)

Copilot 是基于大語言模型(LLM)的實(shí)時(shí)輔助工具,通過上下文感知(如代碼編輯器中的函數(shù)名)和意圖預(yù)測來協(xié)助人類的工作交互模式。其核心技術(shù)是 In-context Learning(根據(jù)當(dāng)前內(nèi)容生成結(jié)果),期望構(gòu)建更智能的人機(jī)協(xié)作工作流。

目前很多 AI 產(chǎn)品的 Copilot 相對于上下文感知和意圖預(yù)測的應(yīng)用還只是一個(gè)最初級的雛形,形式上更接近于一個(gè)單純的控制界面。例如大疆無人機(jī)的 Copilot 界面和交互。

三、算法(Algorithm)

算法是解決問題的明確步驟的規(guī)則集合,例如排序算法、搜索算法。交互設(shè)計(jì)領(lǐng)域中也會涉及到算法,比如規(guī)定“若用戶輸入 A,則優(yōu)先為用戶顯示 XX,其他不推薦項(xiàng)順序排列在下方”等。
在 AI 領(lǐng)域,算法通常指機(jī)器學(xué)習(xí)模型訓(xùn)練和推理的數(shù)學(xué)方法,如梯度下降、決策樹分裂規(guī)則。

四、算法模型(Algorithm Model)

定義: 算法模型是通過數(shù)據(jù)訓(xùn)練得到的數(shù)學(xué)函數(shù)(如神經(jīng)網(wǎng)絡(luò)),能夠從輸入數(shù)據(jù)中提取特征并輸出預(yù)測結(jié)果。例如,卷積神經(jīng)網(wǎng)絡(luò)(CNN)通過多層卷積核提取圖像邊緣、紋理等特征,最終分類為“貓”或“狗”。

算法和算法模型實(shí)際經(jīng)常混用,但嚴(yán)格來說,算法是固定邏輯,比如代碼中的 if—else條件分支,而算法模型是一種概率化預(yù)測,要經(jīng)過數(shù)據(jù)訓(xùn)練。可以理解為一個(gè)是嚴(yán)格執(zhí)行程序的機(jī)械操作,一個(gè)是看過書刷過題真正學(xué)習(xí)理解后的判斷操作。

五、數(shù)據(jù)處理與標(biāo)注(Data Processing & Labeling)

數(shù)據(jù)處理包括清洗(刪除重復(fù)數(shù)據(jù))、歸一化(統(tǒng)一圖片尺寸)、特征提取(將文本轉(zhuǎn)為詞向量);數(shù)據(jù)標(biāo)注是為原始數(shù)據(jù)添加標(biāo)簽(如框出圖片中的狗并標(biāo)注“金毛犬”),是訓(xùn)練“算法模型”的過程,標(biāo)注質(zhì)量直接影響模型效果。

六、自然語言處理(NLP)

NLP 是讓機(jī)器理解、生成人類語言的技術(shù),涵蓋詞法分析(分詞、詞性標(biāo)注)、語義理解(實(shí)體識別、情感分析)、文本生成(對話回復(fù)、文章摘要)。
比如對話流設(shè)計(jì)中根據(jù)意圖識別結(jié)果(如用戶問“退款流程”),預(yù)設(shè)回答分支并標(biāo)注跳轉(zhuǎn)邏輯。

七、計(jì)算機(jī)視覺(CV)

定義: 計(jì)算機(jī)視覺使機(jī)器能“看懂”圖像和視頻,核心技術(shù)包括目標(biāo)檢測(YOLO 模型)、圖像分割(Mask R-CNN)、姿態(tài)估計(jì)(OpenPose)。例如,人臉識別技術(shù)通過提取五官特征點(diǎn)確認(rèn)身份。

如果 AR 應(yīng)用中基于物體識別的信息展示它在真實(shí)環(huán)境里所看不見的內(nèi)容。

在我的《AR 界面設(shè)計(jì)》中,也展開介紹了與此相關(guān)的許多技術(shù)點(diǎn)。

八、強(qiáng)化學(xué)習(xí)(Reinforcement Learning)

強(qiáng)化學(xué)習(xí)通過“試錯(cuò)-反饋”機(jī)制訓(xùn)練 AI,核心要素包括環(huán)境(Environment)、智能體(Agent)、獎(jiǎng)勵(lì)函數(shù)(Reward Function)。例如 AlphaGo 通過與自己下棋獲得勝負(fù)反饋,不斷優(yōu)化策略。

理解技術(shù)的基礎(chǔ)概念和基礎(chǔ)運(yùn)作原理,才能更好的為用戶翻譯、解釋這些技術(shù),從而讓人和智能系統(tǒng)互相理解和信任,創(chuàng)造更好的體驗(yàn)。

共勉、共進(jìn)!

收藏 9
點(diǎn)贊 42

復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。