文/曾慶良(阿亮老師,為教育部高中數學學科中心研究教師、台北市3A教學基地中心主任,獲北市特殊優良教師)
最近一定都有聽過「元宇宙」吧!在一般認知即是一個足夠真實的「虛擬世界」,在這世界中,具備了八大要素:
①身分:在虛擬世界中每個人都可建置與現實無關的虛擬身分。
②朋友:可跨空間與真人或AI進行社交活動。
③沉浸感:以VR/AR等裝置沉浸在元宇宙的體驗當中。
④低延遲:通過平台網路而幾乎同步發生體驗各類活動。
⑤多元化:提供超越現實世界的自由和多元化內容。
⑥隨時隨地:隨時隨地不受時空限制登入元宇宙。
⑦經濟系統:可使用虛擬貨幣進行交易並可兌換現實貨幣。
⑧文明:於虛擬世界形成獨特的文明互動社會機制。
目前大家普遍認為「元宇宙」一詞是誕生自1992年科幻小說《雪崩》中所敘述到「與真實世界平行的虛擬空間」這樣的概念;不過其實在1981年美國數學家和電腦專家弗諾‧文奇在他撰寫的《真名實姓》一書中即講述了網際網路「構想的虛擬世界」中,電腦駭客與企圖控制世界的人工智慧之間的戰爭。如果你想要快速體驗元宇宙發展中的技術,那麼不妨試試AR(擴增實境)科技吧!
所謂的AR科技,就是當你用手機掃描一張圖片時,會透過程式或App,將資訊、圖像、物件、影音等內容,以虛擬的方式疊加在現實環境中。例如我們可以製作掃描某一張指定的植物照片,就可以在手機看到設定好的植物介紹影音;或者掃描一張咖啡機圖片時,就會出現這台咖啡機的互動使用教學;問題來了,為何我們設定好一張圖卡當辨識圖對應到特定資訊,下次再拿起手機掃描這張圖卡就會顯現該資訊呢?另一個問題是:圖卡的選擇對於辨識度有影響嗎?
●告訴你/彩色圖片轉灰階 可增加辨識速度
要了解上述的問題,我們需要理解AR運作的步驟(流程如下)。
以三個顏色:紅(R)、綠(G)、藍(B)構成的圖片像素,我們以數對表示,當我們在製作AR輸入辨識圖卡時,程式會將彩色圖片轉為灰階(例如可以將數對除以3即變為灰階),如此會有比較小的檔案以增加體驗的辨識速度;如下圖①其(R,G,B)數值為(255,0,0)、圖②數值(0,123,0)、圖③數值(0,0,247),而原來的辨識圖片(圖④)數值為(255,123,247),若我們將它除以3則為(85,41,82)形成圖⑤的灰階圖片,而以此當成是辨識圖儲存不僅可以大幅縮小了圖片的大小,而且也不會像圖①、圖②、圖③般那樣讓辨識度下降,另外還要注意照片需要良好的明暗對比才能提高辨識度喔!
●要知道/圖像愈多特徵點 影像辨識率愈高
所謂的特徵點,就像是一張地圖上的標記,有了清楚的標記才能將互動資訊正確的對應到辨識圖,依據上面方式,當我們得到了辨識圖後,程式會將圖片中圖形邊緣曲線亮暗分明的角、尖銳的形標示出來,如下圖標示黃色十字處,我們可以知道因為圓形沒有角,所以沒有特徵點、方形只有四個特徵點、交錯和具有細節的圖案能形成特徵點。一般來說,圖像中有愈多特徵點,就具有愈高的影像辨識率,可產生更靈敏、穩定的辨識效果。
●下一步/用濾波器做卷積 圖片大小更精巧
有了特徵點後,我們可以設計程式,將每個特徵點的像素透過原本已設置好的「濾波器」(Filter)做「卷積」(Convolution)後儲存,讓圖片的大小變得更為「精巧」。這一段聽起來好像很玄,我們舉一個例子就會非常清楚了。例如:有一個辨識圖經過取樣成為灰階並且得到特徵點像素如圖一,而原本程式已設定好的濾波器為圖二。
接下來我們進行卷積運算,以下是卷積計算的第一步:
以下是卷積計算的第二步:
依此規則,我們最後能夠得到最右側的像素數值並加以儲存了。
●要注意/對稱圖案太多 影響辨識效果
從這裡我們可以知道,即使圖像的特徵點數量足夠,但重複或有對稱的圖案太多則會影響辨識效果(因為每個像素數值相近會讓程式猶如得了「近視眼」般傻傻分不清楚),甚至造成無法辨識(如下圖左)。而若存在類似或極為近似的辨識圖案,則會讓程式「頭暈目眩」,分不清方位而影響辨識效果,例如影片倒置等異常狀況(如下圖右)。
如果遇到辨識率低的圖像,我們可以調整明暗對比以凸顯形狀和轉角特徵使其增加特徵點,也可以在影像中加入一些有稜有角變化較多的圖形、文字或背景等,如此就能大幅提升影像的辨識率了。
有人說擴增實境(AR)就好像在現實中「看到鬼」,讓虛擬的影像或互動透過手機疊合在實際的視像中,例如我們可以在和爸媽通Line影像電話時,讓酷炫的眼鏡框套用在爸媽的臉上;或者是開啟手機App掃描課本圖片時,看見火山爆發的過程等,這都是元宇宙中的科技應用。元宇宙的體驗中還有許多有趣的數學原理(例如VR、NFT、區塊鏈或虛擬貨幣),下一次再和你分享其中的奧妙吧!
原文出自《好讀周報》673期