【摘要】物聯(lián)網(wǎng)與大數(shù)據(jù)作為信息爆炸時代的技術(shù)產(chǎn)物,受到社會各界的廣泛關(guān)注,如何利用物聯(lián)網(wǎng)技術(shù)與大數(shù)據(jù)分析算法提升辦案效率,已成為各國警方分析研究的課題。本文構(gòu)想了一套基于物聯(lián)網(wǎng)技術(shù)的警務(wù)大數(shù)據(jù)分析模型,意在探討該套模型在實際應(yīng)用中的可行性,以及可能遇到的困難。
關(guān)鍵詞:物聯(lián)網(wǎng)、大數(shù)據(jù)、警務(wù)信息化
背景介紹
警察作為一個國家的重要機構(gòu),肩負著維護社會穩(wěn)定,打擊違法犯罪的重要職責,面對著越來越狡猾的犯罪分子,警方需要有效提升預防和打擊犯罪的能力,單靠警員人工破案已無法滿足社會需求,因此國家提出“科技強警”的發(fā)展戰(zhàn)略,借助高科技裝備、信息化手段幫助警方打擊違法犯罪,“金盾工程”更是將公安信息化建設(shè)推向了高潮。然而,隨著信息時代的到來,犯罪分子作案手段越發(fā)多變、隱蔽,傳統(tǒng)的信息化手段已很難幫助警方快速分析研判。
近年來,“物聯(lián)網(wǎng)”、“大數(shù)據(jù)”越來越被人們所熟知,著名的“谷歌汽車”、“大數(shù)據(jù)流感預測”更是成為物聯(lián)網(wǎng)技術(shù)與大數(shù)據(jù)預測應(yīng)用的經(jīng)典案例。這兩個在幾年前還不為人知的技術(shù)名詞,仿佛是在一夜之間闖入了我們的生活,將人們拉入了科幻電影中的場景。那什么是“物聯(lián)網(wǎng)”、“大數(shù)據(jù)”呢?
物聯(lián)網(wǎng)技術(shù)是利用互聯(lián)網(wǎng)等通信技術(shù)手段把傳感器、控制器、機器、人與物通過新的方式聯(lián)系在一起,形成人與物、物與物互聯(lián),實現(xiàn)信息化,遠程管理控制和智能化的網(wǎng)絡(luò)。
作為物聯(lián)網(wǎng)之后IT行業(yè)又一大顛覆性的技術(shù)革命,大數(shù)據(jù)是信息爆炸時代的產(chǎn)物,人們每天上網(wǎng)、交流、購物、訂票…… 產(chǎn)生了數(shù)以億級的數(shù)據(jù),而這項技術(shù)的意義并不在于掌握了龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化的預測處理。
警方分析研判的關(guān)鍵是挖掘人員、組織、案(事)件、陣地以及物品五要素之間的關(guān)聯(lián)關(guān)系,如果能夠借助物聯(lián)網(wǎng)技術(shù)獲取五要素信息,那么將大大提升警方獲取線索信息的效率,同時也能避免人為錯誤。而面對龐雜的線索信息,則可以借助大數(shù)據(jù)分析技術(shù)實現(xiàn)深入,高效的挖掘分析,進而快速找出五要素之間的關(guān)聯(lián)關(guān)系。
本文試圖探討構(gòu)建一套基于物聯(lián)網(wǎng)技術(shù)的警務(wù)大數(shù)據(jù)分析模型,借以提高警方線索采集和分析研判過程的準確性和效率。
技術(shù)架構(gòu)
基于物聯(lián)網(wǎng)技術(shù)的警務(wù)大數(shù)據(jù)分析模型是一種利用大數(shù)據(jù)分析算法對海量警務(wù)物聯(lián)網(wǎng)線索信息進行深度挖掘分析的系統(tǒng)模型。它包括了物聯(lián)感知層、數(shù)據(jù)傳輸層、數(shù)據(jù)分析層以及數(shù)據(jù)展示層,同時,它還要與現(xiàn)有的公安信息網(wǎng)有效融合,實現(xiàn)信息共享碰撞。
物聯(lián)感知層
警務(wù)物聯(lián)網(wǎng),是指利用感知技術(shù)與智能裝置對警務(wù)工作關(guān)注對象進行自動感知識別,通過網(wǎng)絡(luò),技術(shù)處理和智能分析,實現(xiàn)對關(guān)注對象狀態(tài)和態(tài)勢信息的實時掌握,達到對關(guān)注對象動態(tài)監(jiān)測、精確管理和科學指揮的目的。目前警方所應(yīng)用的場景有旅客身份證查驗、警車警員GPS定位、城區(qū)視頻監(jiān)控、道路卡口車輛監(jiān)控、重點部位報警防范、重點人員手機定位、槍支RFID標簽定位等,可以采集到人員、車輛以及物品的城市時空數(shù)據(jù),為警方建立基本要素排查提供大量真實可靠的原始數(shù)據(jù)。
數(shù)據(jù)傳輸層
經(jīng)過移動互聯(lián)網(wǎng)、有線網(wǎng)絡(luò)等媒介傳輸?shù)较到y(tǒng)模型的物聯(lián)網(wǎng)數(shù)據(jù),具有數(shù)據(jù)量大,且分布在不同時域,空域的特點,是無法直接使用的,為此需要按照一定的標準規(guī)則對它們進行初步的篩選和歸類整合,將其轉(zhuǎn)化為兼容系統(tǒng)模型的,具有統(tǒng)一規(guī)范標準的“元數(shù)據(jù)”。
數(shù)據(jù)分析層
經(jīng)過初步歸類整合的數(shù)據(jù)依舊是海量且缺乏直觀聯(lián)系關(guān)系,無法為警方提供研判依據(jù),為此需要借助專業(yè)的數(shù)據(jù)挖掘算法對這些數(shù)據(jù)進一步分析、整合。同時還要與公安信息網(wǎng)中的線索與情報進行碰撞,以降低單一數(shù)據(jù)源造成的信息可靠性低等問題。常用的分析算法有分類分析、回歸分析、聚類分析以及關(guān)聯(lián)分析。
分類分析
根據(jù)一定的分類準則將具有不同特征的數(shù)據(jù)劃分到不同類別的過程。以某地區(qū)團伙作案為例,該區(qū)域近一段時期是團伙犯罪高發(fā)期,警方對該區(qū)域以及鄰近區(qū)域娛樂場所以及出租屋的人員進行集中排查,采集到大量的身份證信息和手機串號信息。
通過對午夜時段的身份證號以及手機串號進行碰撞,可以篩選出一批經(jīng)常出入于犯罪高發(fā)區(qū)的可疑人員名單,進而幫助警方縮小排查范圍。
回歸分析
通過對自變量和因變量做一定的相關(guān)性分析,由此建立回歸方程,用以預測變量的依賴關(guān)系。加利福尼亞警方曾利用火災預警系統(tǒng)來預測建筑物火情以及分析縱火案。
加利福尼亞警方通過將一年內(nèi)火災案件與當天天氣,建筑物自身因素等資料數(shù)據(jù)化,形成了一套火災級別與火災因素的擬合函數(shù),當火災因素點越豐富時,擬合出來的火災隱情擬合函數(shù)曲線就越細膩平滑,精準度也就越高,進而形成經(jīng)驗數(shù)據(jù),有效提升火災預警能力。同時,警方也不放過那些異常點,因為往往異常點代表著具有“人為縱火”嫌疑,警方再通過對這些異常點的分析,找出隱藏在火災背后的案情。
聚類分析
不同于分類分析,聚類分析沒有先驗知識,一般是將一堆看似毫無規(guī)則的數(shù)據(jù)根據(jù)某種特征進行劃分,不同屬性的數(shù)據(jù)分到不同的組。警方可以根據(jù)時間或者空間為基準屬性,對采集到的身份證號,報警信息,手機串號等進行分組,進而發(fā)現(xiàn)可疑線索。
例如,某文物保護單位午夜時分發(fā)生文物盜竊案件,通過對該單位近一周內(nèi)的監(jiān)控錄像、手機串號等數(shù)據(jù)的采樣,警方首先將可疑目標鎖定在午夜時段出現(xiàn)的四個手機串號上,因為該時段不可能是正常游客參觀時段,具有可疑性,但由于作案人帶了頭套和手套,未能取得有價值的作案監(jiān)控錄像。警方再對其余時間進行排查碰撞發(fā)現(xiàn),在案發(fā)前三天,可疑目標手機串號出現(xiàn)在文物展覽時段,通過對該時段的監(jiān)控錄像與手機串號進行排查定位,就可以有效縮小排查范圍。
關(guān)聯(lián)分析
用于在大量雜亂無章的數(shù)據(jù)中尋找有價值數(shù)據(jù)間的相關(guān)關(guān)系。
通過分析犯罪嫌疑人的基本信息、親朋好友、交通工具、銀行賬戶以及出行記錄等,就能繪制出一張犯罪嫌疑人的關(guān)系網(wǎng),進而為警方快速掌握犯罪嫌疑人動向提供有力線索。
數(shù)據(jù)展示層
伴隨著大數(shù)據(jù)應(yīng)用而出現(xiàn)的技術(shù)還有可視化展示技術(shù),它能夠很直觀的將大數(shù)據(jù)分析產(chǎn)生的晦澀難懂的數(shù)據(jù)以圖表的形式展示出來,幫助警方根據(jù)圖表特征快速研判。本模型針對警務(wù)案件研判特點,選取了幾種常見的圖表模型做展示。
關(guān)聯(lián)關(guān)系圖
關(guān)聯(lián)關(guān)系圖與關(guān)聯(lián)分析算法配套使用,用于展示研判分析結(jié)果各元素之間的關(guān)系,該圖將各元素分為中心元素和關(guān)聯(lián)元素,關(guān)聯(lián)元素圍繞著中心元素展開。通常用于犯罪嫌疑主體與客體之間的關(guān)聯(lián)關(guān)系!咀ⅲ褐行脑睾完P(guān)聯(lián)元素的要素類型可以相同,也可以不同】
時空時序圖
通常與分類分析算法、聚類分析算法配合使用,按照時空屬性,展示行為主體在一定時空范圍內(nèi)的行為軌跡,通常用于展示犯罪嫌疑人或嫌疑車輛的行為軌跡。
熱點分布圖
通常與聚類分析算法配合使用,用于碰撞挖掘人員行為習慣,關(guān)聯(lián)關(guān)系以及異常行為之間的“共性”。
應(yīng)用架構(gòu)
基于物聯(lián)網(wǎng)技術(shù)的警務(wù)大數(shù)據(jù)分析模型本身不能直接破案,但它可以幫助警方縮小排查范圍,縮短排查用時。由于它需要整合多方信息資源,因此是一套跨部門,跨警種的分析應(yīng)用模型。
水平維度
刑偵 |
治安 |
反恐 |
緝毒 |
戶籍 |
結(jié)論數(shù)據(jù) | |
元素1 |
A |
A |
|
|
A |
A |
…… |
|
B |
C |
|
B |
B |
元素N |
D |
|
D |
D |
|
D |
警方在辦案過程中經(jīng)常會遇到多警種配合工作的情況,而各警種獲取線索信息的渠道可能有所不同,導致對同一個目標元素得到不同的數(shù)據(jù),這時就需要對大家獲取的信息進行核實,并以某一個或多數(shù)人的信息為最終結(jié)論數(shù)據(jù)。(注:依靠物聯(lián)網(wǎng)技術(shù)獲取的數(shù)據(jù)會降低數(shù)據(jù)的差異性概率,但案件線索并非只有物聯(lián)網(wǎng)采樣數(shù)據(jù),還有很多數(shù)據(jù)要通過其他渠道獲得)
垂直維度
基層派出所 |
分局 |
市局 |
省廳 | |
應(yīng)用面 |
采集 |
采集 |
分析 |
統(tǒng)計評估 |
分析 |
采集 |
在應(yīng)用這套模型時,應(yīng)該按照不同級別,職能分工使用。基層單位主要負責線索的采集,實際辦案單位則肩負線索采集和分析研判過程,而省廳則作直接利用分析研判結(jié)果,對各區(qū)域的治安情況,警員的工作情況進行分析考核。
建設(shè)難點
雖然物聯(lián)網(wǎng)、大數(shù)據(jù)已經(jīng)不再是個陌生的技術(shù),它也已經(jīng)被廣泛應(yīng)用到各行各業(yè),小到“物品標簽”,大到“百度大數(shù)據(jù)分析計劃”,似乎這兩類技術(shù)無所不能,但事實上,要想充分發(fā)揮技術(shù)的優(yōu)勢,還需要一定的條件。
物聯(lián)網(wǎng),它被憧憬的應(yīng)用形式之一便是連接城市,各種各樣的傳感器,視頻監(jiān)控無處不在,追中人們的行動并生成大量的數(shù)據(jù),從而更高效的管理城市,但物聯(lián)網(wǎng)技術(shù)的軟硬件缺乏一個統(tǒng)一或者相對統(tǒng)一的標準,很難靠一家技術(shù)公司就能對接,整合各家的設(shè)備或系統(tǒng)。
大數(shù)據(jù),一項偉大的發(fā)明,它將“星占卜”變成了“現(xiàn)實”,但從它的詞意就可以知道,它的樣本即全部,需要大量且非單一的數(shù)據(jù)做支撐,“共享”必不可少,但首先要解決各部門間的信息壁壘,以及跨公安網(wǎng)信息交互引起的信息安全問題。
文章總結(jié)
雖然筆者通過理論依據(jù)以及工作實踐總結(jié)出了這套系統(tǒng)模型,但模型應(yīng)用到實際,并構(gòu)建出完整的可實用的軟件系統(tǒng)仍然有很長一段路需要走,這需要公安干警以及相關(guān)行業(yè)技術(shù)從業(yè)者的共同努力。
技術(shù)手段不可能直接用于破案,但如果能夠科學合理的應(yīng)用,充分發(fā)揮它的作用,就能大大提升警方辦案效率。而這些都是建立在完備的管理機制和人員認識之上的,需要警方、科學工作者以及社會共同的努力。
|