(法顧專屬)AI人工智慧導入法令遵循機制之趨勢

說明
在這「監管科技」的世代,利用人工智慧協助企業進行法令遵循已成為趨勢。例如在洗錢防制上,多家銀行導入AI系統協助分析比對客戶是否在監測名單之列;美國證管會目前的系統已可以做到每天要能分析500億個證券交易行為並找出異常;在美國E-discovery也已成為訴訟上調查或是保全電子文件之證據常出現的手段,藉由關鍵字的找尋特定範圍以及時間內的相關電子文件,不少資訊公司也會提供如何使用ediscovery相關查詢以及篩選的系統,例如微軟公司;微軟本身亦有Microsoft Azure等相關系統協助協助用戶資料庫符合業界之法規需求。
在競爭法領域中亦可藉由人工智慧輔助完善法令遵循機制,進行內部稽核。目前常見的方式是透過監察電子郵件(email-auditor)之機制,攔阻具有聯合行為等疑慮內容之郵件來往,避免違法情事發生。此種方式常見的作法有下特定的關鍵字,若信件中含有該關鍵字者,一律攔阻並通知管理者,但這個做法的缺點就是誤判率高,且管理者及使用者都必須在訂定規則上投入相當的時間精力,並且每隔一段時間就必須重新檢查規則的適當性。因此,不少廠商透過機器自動學習(machine learning)、自動語意分析、貝式分析過濾(Bayesian Filtering)等方式更精確的處理郵件之篩選。企業可以預設幾種分析的結果類型,然後必須先提供足夠數量的各類型樣本,讓系統分析學習並建立模式,透過分析樣本的訓練,日後電子郵件過濾系統將會自動判斷。或是系統先準備兩種不同郵件的範本,一組是合法的郵件另一組則是涉嫌違法的郵件,系統透過兩組樣本中的文字出現頻率分系,再與欲偵測之郵件比對,運算評估這封信為某種類郵件的可能性。
不過光是透過對話文字上為防治有其侷限性,因此,或許能夠藉由其他相關數據的監測或是名單的建立以防範聯合行為等不法情事之發生。例如:透過正式平台建立相關廠商之產品、價格走向等市場公開資訊數據之觀測,或是比對郵件中附帶檔案的價目表或報表,建立敏感注意清單,針對清單內的事件或是廠商設定較嚴格之篩選機制等等,再搭配郵件篩選機制,或能更加完善違法偵測機制。


參考文獻
UBIC (2014). UBIC's "Lit i View EMAIL AUDITOR" Gains Traction With Major Japanese Manufacturers:http://www.fronteo.com/global/news/uploadfile/docs/UBIC_News_2014_12_15_General_Releases.pdf
Openfind(2005)。一場永無止盡的戰爭反垃圾郵件市場的概況與技術解析。上網日期:2006年11月27日。檢自:http://www.openfind.com/taiwan/download/report/anti_spam_01_20051118.pdf
關鍵字怎麼下?
首先,介紹關鍵字的來源:(1)法律書狀中對於事實層面的論述常成為各種關鍵名稱和詞彙的重要來源。(2)自身客戶,整體而言,企業內部的法令遵循和產業本身特性離不開關係,因此,身處產業核心的客戶本身其實有很大的機會提供更多關鍵字的靈感,此外,客戶有時手上就握有關鍵重要的文件,而這些文件也是主要的關鍵字來源。(3)在爭訟過程的ediscovery中,也會藉由與對造律師或法務的協商溝通共創關鍵字清單。最後,(4)電子文件(electronically stored information,ESI)本身也是重要的關鍵字來源,最有效率的方式是檢視具少量但具高度相關的文件,例如欲調查事件的企劃案,重要涉案人員在特地期間內且符合某些關鍵字的電子郵件等。
好的語法設計(search syntax),絕對是重要的,必要不必要的干擾字詞,例如量詞等等,以避免漏掉重要的文件,又或者是善用連接詞,例如AND, OR and AND NOT, within sentence (w/s), within paragraph (w/p) or within a set number of words (e.g., w/10)等,幫助提升資料找尋的精準度。
再者,關鍵字的建立非一蹴可及,藉由不斷的追蹤搜尋結果,檢視關鍵字找尋結果的報告(hit count report),以修正前次關鍵字的範圍,或許是加入新的關鍵字詞或次刪除命中率低的關鍵字,以期不斷建立更精準的關鍵字。此外,從命中率意外的高或意外的低的關鍵字所產生的搜尋結果建立樣本,交叉比對,通常也可以藉此發現看似有命中,實則毫無用處的關鍵字找尋結果(false positive)。

了解更多
→ Building Blocks of Effective Keyword Search
→ Electronic Discovery – Keyword Searches
→ ESI Data Mapping Basics for eDiscovery