跳到主要內容

國立公共資訊圖書館

Menu

讀者服務

本館出版品

科技偵查情報站 從AI圖文辨識打開治安新視角

文:張名榕 照片提供:國家高速網路與計算中心
「智慧偵防車載系統」搭配巡邏警車GPS定位,把拍攝照片連同座標送回雲端運算平台,進行AI模型訓練。

臺灣街頭隨處可見的招牌、看板、海報,除了有宣傳攬客的功能,還能如何應用呢?國家高速網路與計算中心在國立公共資訊圖書館舉辦的「看穿你的微文字:從招牌到場景,圖片開口說話的秘密」特展,告訴你如何藉由AI圖文辨識技術,保障民眾的生活更安全!

 

  國家高速網路與計算中心(以下簡稱國網中心)隸屬國家實驗研究院,擁有大型計算平台與學術研究網路設施,長期推動國內高速計算技術的科研發展。國網中心致力於「生成式人工智慧」、「大型語言模型」以及「智慧物聯網」等科學研究與技術研發,「圖文辨識技術」即為其中之一,如今,研究團隊將此項技術結合街景分析,開拓更多元的應用模式。 


AI圖文辨識 精準判斷所在地

「智慧偵防車載系統」搭配巡邏警車GPS定位,把拍攝照片連同座標送回雲端運算平台,進行AI模型訓練。

  為了使觀展民眾快速理解「圖文辨識」,國網中心使用汽車模型搭載攝影機,示意車輛上所配置的車載監控方式,透過國立臺灣科學教育館、國立自然科學博物館、國立科學工藝博物館以及國立公共資訊圖書館等單位的照片,由民眾以轉軸推動照片前進,當攝影機拍攝到照片裡場館的招牌文字時,會將影像傳輸至雲端計算進行圖文分析及定位,判斷模型車位於哪座場館,並於螢幕上秀出該場館的相關資訊。國網中心研究員曾建澔表示,早期的文字辨識技術是「光學字元辨識」(Optical Character Recognition, OCR),將紙本平面文字轉換成數位資訊,對於文件的排版工整度有很高的要求;而國網中心在研發AI圖文辨識技術時,不僅要從靜態轉為動態,還必須從零到有設置專屬繁體字的AI模型,辨識街景時更是面臨艱鉅挑戰,原因是臺灣招牌的字體、字型、排版、顏色五花八門,必須花費許多時間訓練AI模型。「識別招牌文字時,如果有鏡頭拍攝角度不夠正,場景光線不夠亮,文字被樹蔭遮擋等狀況,過去的OCR技術就無法辨識,但經過多年研發修正,加上AI技術補強,現在的辨識技術正確率可高達95%。」曾建澔說。

 

智慧車載蒐集資料 提高破案效率

國網中心進一步研發「場景樣態辨識技術」,透過AI模型提取自然場景中相對固定的背景特徵,例如建築物,並應用高速計算進行街景圖像匹配及相似比對。

  高度精準的圖文辨識技術,數年前被臺中市政府警察局刑事警察大隊(以下簡稱臺中市刑大)相中,便攜手國網中心聯合共同創建「數位孿生警政偵查平台:TCPB 情資助理」,藉由新科技協助警政系統做好智慧安防,維護城市治安。國網中心研究員吳志泓指出,隨著手機普及,民眾經常將拍到的衝突事件上傳網路,若缺乏充足資訊,警方會為了尋找事發地疲於奔命,建立平台可以協助警方快速定位並展開調查。


  「只要有拍到招牌或街景,可以進入雲端資料庫分析,快速找出事發地,警方可以立刻調查鄰近的通緝犯,同時調閱監視器影像了解事發經過,大幅縮短偵蒐時間。」吳志泓也補充,就算事發地沒有招牌文字,新型態的模型也能比對影像背景特徵,警方只要上傳圖像,就能「以圖搜地」,比對出數個可能的事發地點,比起過往繁雜的人工比對,效率高出許多。

 

國網中心使用汽車模型搭載攝影機,並於螢幕秀出資訊,協助民眾快速理解「圖文辨識」的具體功能。

  偵查平台需要大量的比對資料,國網中心先將教育部常用字庫內的5,021個字,進行文字訓練作為AI系統基礎模型,接著,協同臺中市刑大建立「智慧偵防車載系統」,警車邊巡邏,邊使用前後左右四個鏡頭拍攝沿路的招牌、路標與廣告看板,搭配GPS定位系統,把拍攝照片連同座標送回國網中心「TWCC臺灣AI雲」雲端運算平台,進行AI模型訓練及分析,目前已在全臺中市累積超過100萬張照片,並持續擴充中。透過圖文辨識技術,臺中市警察局成功破獲多起在網路上傳播的暴力事件,包括大里區夜校生鬥毆、清水區惡作劇開槍影片等,都是透過網路影片出現的招牌文字快速定位,幫助警方逮捕嫌疑犯或釐清假消息,對維護治安有莫大助益。「智慧偵防車載系統」也在本次展覽中共同展示,民眾不妨前來探訪,了解圖文辨識對維護治安的出色貢獻。

 

「看穿你的微文字:從招牌到場景,圖片開口說話的秘密」特展

展覽日期:2025年7月22日(二)至10月30日(四)
展覽地點:國立公共資訊圖書館總館2樓微型展區

 

 

讀者登入
回頂部