一窺海賊團的犯罪祕辛
圖|研之有物(圖片來源|iStock)
事實上,茫茫大海並沒有這麼「茫」,海上活動看似難以捉摸,其實在船隻及人員的出海紀錄中,都留有蛛絲馬跡,這些紀錄也成為研究海上犯罪的重要資料庫,而偵破組織犯罪的關鍵線索,就在其中。
「任何形式的社會網絡我都非常好奇!」江彥生談起研究動機:「尤其是那些具有神祕色彩的地下組織,像是詐騙集團或恐怖組織。這些組織為了達成目的,需要保有隱密性,這樣的特質非常吸引社會學家一探究竟。」
在這樣的情境下,海巡署以前瞻的視野,看到檔案數位化及犯罪網絡分析,對未來執法的重要性,提供了江彥生「去識別化」的臺灣海上活動數據。藉由對這些數據的網絡分析研究,執法人員將能比過往更加掌握犯罪者的行為模式。
中研院社會學研究所江彥生研究員 圖|研之有物
用數據布下天羅地網,揭露海賊行為模式
究竟「海賊們」和「一般漁民」的海上活動行為模式,有什麼不同之處呢?
首先,我們來看看手上握有的數據。海巡署提供的是 2016 至 2018 年的臺灣海上活動數據,當中涵蓋了超過 5 萬人的出海紀錄,包括犯罪事件、逮捕紀錄、港口管理系統和船舶註冊等資料。
江彥生以這些數據,繪製了一個由 53,009 個節點和 2,592,288 個加權鏈路(註)所組成的海上同航網絡。為了處理龐大的資料,特別採用「自助抽樣法」(俗稱拔靴法,bootstrap resampling)來估計犯罪者和非犯罪者同航網絡的結構特徵。
"什麼是「自助抽樣法」呢?這是一種從龐大母群體中抽出代表性樣本,再透過隨機重複抽樣,來推論母群體真實分配的統計方法。"
舉例來說,假設海賊世界中高高在上的天龍人首腦,想知道聖地馬力喬亞周遭海賊團的犯罪行為模式,是混在人群中趁機犯案?還是以地下組織祕密行動?
由於蒐集到的資料當中,有犯罪紀錄的人遠比無犯罪紀錄的良民少之又少,為了處理這種「非對稱」的資料,首腦決定先從所有資料中抽出一群可以測量的樣本,再從中隨機重複抽樣後放回,並將每次抽出的樣本統計量記錄下來,讓許許多多的樣本統計量排列成機率分配圖表,就可以推估海賊團可能會以什麼策略行動。
這個方法的好處是,不用知道母群體真實的情況,就可以推論出可能的分布樣貌,以現有的數據「自助式」驗證手上資訊的特性。就像被沼澤困住的孟喬森男爵(Baron Munchausen),與其呼喊救兵,不如靠自己的力量,抓住皮靴上的帶子,奮力從泥淖中拔出雙腳(bootstrap)。
自助抽樣法示意圖 圖|研之有物
「這是一次難得的合作!」江彥生指出本次研究的特殊性:「過往的研究大多聚焦在犯罪者本身的網絡分析,較少將犯罪者網絡與同一時空背景下的非犯罪者網絡進行比較。」
藉由自助抽樣法,我們掌握了廣大同航網絡的結構特徵,也能進一步了解,海上犯罪者的行為模式是傾向「魚目混珠」或「藏匿行蹤」。
線索一:魚目混珠或藏匿行蹤?
常看柯南的你一定知道,犯人通常不會大辣辣地讓人一眼識破,通常是混在人群中趁機犯案,或故意製造不在場證明,讓自己看起來無異於他人。這樣的「魚目混珠」策略是常見的犯罪手法。
但在海上犯罪的研究中,江彥生發現,大海的無邊無際反而讓犯罪者沒有混充一般漁民的必要。犯罪者只要在出海時不露出馬腳,一旦到了海上,就可以「藏匿行蹤」,從事非法勾當。
線索二:無懼風雨,也要一起出海?!
研究還發現,犯罪者不會跟外界(非犯罪者)有過多接觸,通常只會和內部成員聯繫,而成員之間的行動模式也傾向在短期內共同、密集出海。相較於看天氣決定是否出海的漁民,犯罪者無懼風雨的出航舉動顯得相當突兀。
換句話說,犯罪者的同航網絡有較強的凝聚度,假設 A 和 B 有連結、B 和 C 有連結、C 又和 D 有連結,那麼 D 就有可能和 A 有所連結。這樣封閉且緊密的內部網絡,讓外界不容易察覺犯罪行為。
利用同航紀錄來推估海上作業員(包含犯罪者與一般漁民)之間的關係。圖中的 B 和 D 是犯罪者,兩人的同船頻率比一般漁民高。 圖|研之有物(資料來源|江彥生)
線索三:誰是幕後主使?關注異常出海紀錄
犯罪集團成員之間經常有明確的分工,有人負責第一線的走私貨物運送,冒著容易被抓的高風險,但這些人通常是對集團內部所知不多的「車手」,就算被抓到也不容易曝露集團核心資訊。
江彥生認為,最需關注的是集團中扮演「溝通橋梁」的角色,他們能夠協調內部分工、獲取外部情報。透過分析犯罪者多次的同航紀錄,就有機會發現某些人的紀錄異常密集,進而推測出哪些人可能是集團幹部。未來若搭配 GPS 定位追蹤,也有助釐清海上犯罪生態。
「嫌疑犯」的現身,研究發現並非偶然!
然而,也有人質疑,當前的資料已清楚知道誰是犯罪者,對於那些逍遙法外的不法份子,又該如何確認他們也具有同樣的網絡特徵?
為此,江彥生除了比較犯罪者與非犯罪者的網絡特徵,還特別加入新角色「嫌疑犯」進行三方比較。嫌疑犯的定義是沒有犯罪紀錄,但同航紀錄顯示他們經常與犯罪者一同出海。
簡而言之,研究團隊將犯罪者、非犯罪者、嫌疑犯這三組人馬,各分成「經驗網絡」(研究組)與「隨機網絡」(對照組)來進行比較,以證明數據的可靠性及非偶然性。
經驗網絡是基於海巡署的資料內容,來確認海上犯罪者實際的同航情形。隨機網絡則是從包含犯罪者和非犯罪者的同航紀錄中,隨機抽取其中數據,然後打亂它們的連結結構。為了證明經驗網絡記錄的真實世界互動關係,並不是由隨機因素引起,我們需要以隨機網絡進行對照。
研究顯示,犯罪者和嫌疑犯之間的關聯性並非偶然,其經驗網絡與隨機網絡比較之後,皆具有統計上的顯著性。
"具體而言,犯罪者與嫌疑犯的網絡特徵相似,兩者的齊同度(與相同屬性者同航)、凝聚度(眾多人一起出航的機率)都比非犯罪者高,代表海上犯罪者們傾向以匿蹤方式共同出航。"
比較不同屬性的海上作業員(犯罪者、一般漁民、嫌疑犯)在同航網絡上的差異。Y 軸數值分別是網絡「齊同度」與「凝聚度」的量化指標,研究人員以這些指標來衡量網絡中不同身分者,是否傾向與相同屬性的人有連結關係。圖表顯示,犯罪者與嫌疑犯皆傾向一起匿蹤同航。 圖|研之有物(資料來源|江彥生)
跟我們想像的海上犯罪有些出入的,還有犯罪型態。
江彥生在與海巡署人員交流的過程中得知,海上犯罪案件大多是走私貨物、倒廢油、炸魚等小型犯罪,預想中的販毒、偷渡等大型犯罪反而少見。這可能跟臺灣的刑度較高、被抓風險較大有關,犯罪者會更加嚴謹地控管成員活動,導致有關單位能掌握的資料相對有限。
「原本的計畫也想針對販毒進行深入研究」,江彥生回顧研究過程:「由於原始數據沒有細分不同的犯罪型態,只能進行比較有限的分析,但不失為一個好的研究開端。」
AI 與社會科學聯手!打擊並預防犯罪的最佳途徑
江彥生說明 AI 技術在辦案上的應用與挑戰。 圖|研之有物
AI 的發展也是江彥生長期關注的議題。談到 AI 技術在辦案上的應用,江彥生指出:「執法人員的目標就是抓到犯人,因此 AI 的功能是計算大量數據,從中提取有用的資訊,協助執法人員可以更迅速地做出判斷和決策。」
要 AI 幫忙判斷誰是犯罪者的前提是,必須提供包括各種線索的資料,例如研究人員估計出的社會網絡結構特徵,可以讓 AI 分析出組織犯罪的行為模式,進而像電影《關鍵報告》般,預測未來的犯罪發生機率。
然而,江彥生也指出當前面臨的挑戰。如果犯罪者的數據樣本偏少,而普通人的數據樣本非常多,就會影響到 AI 做出的判斷結果。
例如在本次海巡署提供的資料中,只有約 700 筆資料屬於犯罪者,其他 4 萬多筆都是非犯罪者,如果要讓 AI 推測誰是犯罪者,AI 判斷為「非犯罪者」的正確率會比較高。因此,如何平衡兩者之間的數據比例,讓 AI 做出更精確的判斷,是使用 AI 執法時必須克服的難題。
此外,江彥生也提到,社會科學家對犯罪者的關注重點,和只想快速得知結論的 AI 應用有所不同,研究者試圖揭露的是犯罪行為的背後動機,而不僅僅是表面的數據和模式。
"針對不同個案的長期追蹤調查,雖然不如 AI 直接預測來的有效率,卻有助於從根本制定預防犯罪的策略。若 AI 技術搭配社會科學的深度分析,應能建構出打擊犯罪、也預防犯罪的最佳途徑。"
這次研究計畫透過網絡統計分析,揭示了臺灣海上犯罪的網絡結構特徵,讓海賊團的犯罪行為模式露出些許馬腳。未來也有擴展研究範圍的潛力,例如從臺灣周遭海域到整個東南亞地區,更廣泛、深入地揭露海上犯罪生態。
註:「鏈路」是指從一個節點到相鄰節點的一段物理線路,中間沒有其他的交換節點。「加權」是指改變某些數據值的比重。當研究人員發現某些群體的數據抽取過多或過少,便會進行加權,使統計結果能符合現實情況。
採訪撰文|劉韋佐
責任編輯|田偲妤
美術設計|蔡宛潔