<acronym id="owqss"><center id="owqss"></center></acronym>
<acronym id="owqss"></acronym>
<acronym id="owqss"><center id="owqss"></center></acronym>

基于時間距離的時空重排掃描優化方法

楊威 龍華 王美 杜慶治

引用本文:
Citation:

基于時間距離的時空重排掃描優化方法

    作者簡介: 楊 威(1992?),男,山西人,碩士生,研究方向為信息處理. E-mail:513079328@qq.com;
    通訊作者: 龍華, longhua@kmust.edu.cn
  • 中圖分類號: TP311.13

Space–time permutation scanning optimization method based on multi-factor distance

    Corresponding author: LONG Hua, longhua@kmust.edu.cn ;
  • CLC number: TP311.13

  • 摘要: 針對時空重排掃描方法掃描使用中,通過空間直線距離來測量兩觀測點間距會忽略城市中的樓房、公園等障礙物等因素,導致兩點間測得真實距離的偏差,從而對掃描結果造成影響, 提出了一種基于時間距離的時空重排掃描優化方法. 首先依據城市中障礙物對兩點間實際路徑的影響得到觀測點間的真實路徑,然后利用真實路徑計算得到兩觀測點間的交通時間,最后利用交通時間來代替表示兩點間的真實距離. 通過舊金山火災數據集對本文優化方法進行驗證,模型性能普遍提升了2%~5%.
  • 圖 1  時空重排掃描示意圖

    Figure 1.  Schematic diagram of space-time permutation scan statistic

    圖 2  事件因子傳播路徑示意圖

    Figure 2.  Schematic diagram of the event factor propagation path

    圖 3  時空重排掃描優化方法基本原理圖

    Figure 3.  Basic schematic diagram of space-time permutation scan optimization method

    圖 4  時空重排掃描優化方法流程圖

    Figure 4.  Flow chart of space-time permutation scan optimization method

    圖 5  42個觀測點火災實際發生情況圖

    Figure 5.  Actual situation of fire at 42 observation points

    圖 6  2018年2月1日~2018年2月7日時空重排掃描方法掃描結果

    Figure 6.  Scanning results of the Space–Time Permutation Scanning method from February 1 to 7, 2018

    圖 7  2018年5月1日~2018年5月7日時空重排掃描方法掃描結果

    Figure 7.  Scanning results of the Space–Time Permutation Scanning method from May 1 to 7, 2018

    圖 8  2018年10月1日~2018年10月7日時空重排掃描方法掃描結果

    Figure 8.  Scanning results of the Space–Time Permutation Scanning method from October 1 to 7, 2018

    表 1  舊金山火災事件觀測地點編號

    Table 1.  Numbers of the fire incident observation site in San Francisco

    地點名稱地點編號地點名稱地點編號
    Tenderloin1Outer Richmond8
    Mission2Inner Sunset9
    South of Market3Mission Bay10
    Haight Ashbury4Pacific Heights11
    Noe Valley5Parkside12
    North Beach6······
    Financial District7Seacliff42
    下載: 導出CSV

    表 2  時空重排掃描數據集

    Table 2.  Scanned data sets of the space–time permutation

    地點
    編號
    日期火災事件
    發生數
    地點
    編號
    日期火災事件
    發生數
    402018-01-01132018-01-011
    252018-01-01322018-01-013
    182018-01-01512018-01-011
    162018-01-011322018-01-011
    102018-01-011172018-01-011
    72018-01-015······
    42018-01-011272018-12-311
    下載: 導出CSV

    表 3  實際發生火災的觀測點情況

    Table 3.  Observation points of actual fires

    時間實際發生火災事件的觀測點觀測點個數
    2018-2-8~2018-2-14 [1,2,3,4,6,7,8,9,10,11,12,13,14,16,17,18,19,20,21,22,23,24,25,27,28,29,30,32,33,35,36] 31
    2018-5-8~2018-5-14 [1,2,3,4,5,6,7,8,10,12,13,14,16,17,18,19,20,21,22,23,24,25,26,27,29,30,33,38,39] 29
    2018-10-8~2018-10-14 [1,2,3,4,6,7,8,9,10,11,12,13,14,15,16,17,18,20,21,22,23,24,26,28,29,30,31,32,33,34,36,37,39] 33
    下載: 導出CSV

    表 4  2018年2月1日~2018年2月7日時空重排掃描方法預警觀測點

    Table 4.  Early warning observation points of the Space–Time Permutation Scanning method from February 1 to 7, 2018

    掃描方法預警觀測點
    傳統方法 [2, 4, 5, 8, 9, 10, 12, 13, 14, 15, 17, 18, 22, 23, 24, 25, 26, 29, 30, 31, 32, 33, 34, 35, 38, 39, 40, 41, 42]
    優化方法 [1, 2, 3, 4, 5, 9, 10, 12, 13, 14, 15, 17, 18, 22, 23, 24, 25, 29, 30, 31, 32, 33, 35, 38, 40, 41, 42]
    下載: 導出CSV

    表 5  2018年5月1日~2018年5月7日時空重排掃描方法預警觀測點

    Table 5.  Early warning observation points of the Space–Time Permutation Scanning method from May 1 to 7, 2018

    掃描方法預警觀測點
    傳統方法[1, 3, 8, 11, 13, 16, 18, 20, 21, 22, 24, 27, 31, 35, 36, 37, 38, 39, 40, 41, 42]
    優化方法[1, 3, 4, 7, 8, 9, 10, 11, 17, 18, 20, 21, 24, 26, 27, 28, 29, 34, 37, 39, 40, 41, 42]
    下載: 導出CSV

    表 6  2018年5月1日~2018年5月7日時空重排掃描方法預警觀測點

    Table 6.  Early warning observation points of the Space–Time Permutation Scanning method from October 1 to 7, 2018

    掃描方法預警觀測點
    傳統方法[1, 2, 3, 4, 6, 7, 8, 9, 11, 14, 15, 16, 17, 20, 21, 26, 27, 28, 29, 34, 35, 36, 37, 38, 39, 40, 41, 42]
    優化方法[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 17, 18, 20, 21, 25, 26, 27, 28, 29, 31, 34, 35, 36, 37, 39, 40, 41, 42]
    下載: 導出CSV

    表 7  2018年2月1日~2018年2月7日2種方法掃描結果的 ${S\!_{\rm{P}}}$、${S\!_{\rm{R}}}$$F$

    Table 7.  ${S\!_{\rm{P}}}$, ${S\!_{\rm{R}}}$ and $F$ of the scanning results of the two methods from February 1 to 7, 2018

    掃描方法評價指標傳統方法優化方法
    ${S\!_{\rm{P}}}$61.3%64.5%
    ${S\!_{\rm{R}}}$65.5%74.1%
    $F$ 0.316 0.345
    下載: 導出CSV

    表 8  2018年5月1日~2018年5月7日2種方法掃描結果的 ${S\!_{\rm{P}}}$、${S\!_{\rm{R}}}$$F$

    Table 8.  ${S\!_{\rm{P}}}$, ${S\!_{\rm{R}}}$ and $F$ of the scanning results of the two methods from May 1 to 7, 2018

    掃描方法
    評價指標
    傳統方法優化方法
    ${S\!_{\rm{P}}}$44.8%51.7%
    ${S\!_{\rm{R}}}$61.9%65.2%
    $F$ 0.26 0.288
    下載: 導出CSV

    表 9  2018年10月1日~2018年10月7日2種方法掃描結果的 ${S\!_{\rm{P}}}$、${S\!_{\rm{R}}}$$F$

    Table 9.  ${S\!_{\rm{P}}}$, ${S\!_{\rm{R}}}$ and $F$ of the scanning results of the two methods from October 1 to 7, 2018

    掃描方法
    評價指標
    傳統方法優化方法
    ${S\!_{\rm{P}}}$66.7%78.7%
    ${S\!_{\rm{R}}}$78.6%78.8%
    $F$ 0.361 0.393
    下載: 導出CSV
    鸿禾娱乐
  • [1] Cressie N, Wikle C K. Statistics for spatio-temporal data[M]. New Jersey: John Wiley & Sons, 2015.
    [2] 李敏, 何紅弟, 郝楊楊. 上海市大氣環境中PM2.5/PM10時空分布特征[J]. 云南大學學報:自然科學版, 2019, 41(2): 323-332. Li M, He H D, Hao Y Y. Spatial and temporal variability of PM2.5/PM10 ratio in Shanghai[J]. Journal of Yunnan University: Natural Sciences Edition, 2019, 41(2): 323-332.
    [3] Atluri G, Karpatne A, Kumar V. Spatio-temporal data mining: A survey of problems and methods[J]. ACM Computing Surveys (CSUR), 2018, 51(4): 83. DOI:  10.1145/3161602.
    [4] Karpatne A, Faghmous J, Kawale J, et al. Earth science applications of sensor data[M]// Managing and Mining Sensor Data, Springer, Boston, MA, 2013: 505-530. DOI: 10.1007/978-1-4614-6309-2_15.
    [5] Shi Z, Pun-Cheng L S C. Spatiotemporal data clustering: A survey of methods[J]. ISPRS International Journal of Geo-Information, 2019, 8(3): 112. DOI:  10.3390/ijgi8030112.
    [6] 李智, 李衛紅. 點模式條件下的犯罪嫌疑人時空同現模式挖掘與分析[J]. 地球信息科學學報, 2018, 20(6): 827-836. DOI:  10.12082/dqxxkx.2018.180009. Li Z, Li W H. Mining and analyzing spatiotemporal Co-occurrence patterns among criminal suspects under point pattern[J]. Journal of Geo-Information Science, 2018, 20(6): 827-836.
    [7] 張婷, 程昌秀, 楊山力, 等. 時空聚集性探測方法在極端高溫事件聚集分析中的應用研究[J]. 地理與地理信息科學, 2019, 35(3): 51-57. DOI:  10.3969/j.issn.1672-0504.2019.03.008. Zhang T, Cheng W X, Yang S L, et al. Application of spatio-temporal aggregation detection method in extreme high temperature aggregation analysis[J]. Geography and Geo-Information Science, 2019, 35(3): 51-57.
    [8] 呂丹, 龍華, 趙繼東, 等. 基于地圖地理信息點的數據融合算法的改進[J]. 西北大學學報:自然科學版, 2017, 47(5): 687-692. Lv D, Long H, Zhao J D, et al. An improved data fusion algorithm based on geographic information points[J]. Journal of Northwest University: Natural Science Edition, 2017, 47(5): 687-692.
    [9] Duczmal L, Assuncao R. A simulated annealing strategy for the detection of arbitrarily shaped spatial clusters[J]. Computational Statistics & Data Analysis, 2004, 45(2): 269-286. DOI:  10.1016/S0167-9473(02)00302-X.
    [10] Naus J L. Clustering of random points in two dimensions[J]. Biometrika, 1965, 52(1-2): 263-266. DOI:  10.2307/2333829.
    [11] Loader C R. Large-deviation approximations to the distribution of scan statistics[J]. Advances in Applied Probability, 1991, 23(4): 751-771. DOI:  10.2307/1427674.
    [12] Turnbull B W, Iwano E J, Burnett W S, et al. Monitoring for clusters of disease: application to leukemia incidence in upstate New York[J]. American Journal of Epidemiology, 1990, 132(S1): 136-143. DOI:  10.1093/oxfordjournals.aje.a115775.
    [13] Kulldorff M. A spatial scan statistic[J]. Communications in Statistics-Theory and methods, 1997, 26(6): 1 481-1 496. DOI:  10.1080/03610929708831995.
    [14] Kulldorff M. Prospective time periodic geographical disease surveillance using a scan statistic[J]. Journal of the Royal Statistical Society: Series A (Statistics in Society), 2001, 164(1): 61-72. DOI:  10.1111/1467-985X.00186.
    [15] Kulldorff M, Heffernan R, Hartman J, et al. A space–time permutation scan statistic for disease outbreak detection[J]. PLoS Medicine, 2005, 2(3): 216-224. DOI:  10.1371/journal.pmed.0020059.
    [16] Fanaeet H, Gama J. Eigenspace method for spatiotemporal hotspot detection[J]. Expert Systems, 2015, 32(3): 454-464. DOI:  10.1111/exsy.12088.
    [17] Ullah S, Daud H, Dass S C, et al. Detecting space-time disease clusters with arbitrary shapes and sizes using a co-clustering approach[J]. Geospatial Health, 2017, 567(12): 210-216. DOI:  10.4081/gh.2017.567.
    [18] Choi H, Song E, Hwang S, et al. A modified generalized lasso algorithm to detect local spatial clusters for count data[J]. AStA Advances in Statistical Analysis, 2018, 102(4): 537-563. DOI:  10.1007/s10182-018-0318-7.
    [19] Katragadda S, Chen J, Abbady S. Spatial hotspot detection using polygon propagation[J]. International Journal of Digital Earth, 2019, 12(7): 825-842. DOI:  10.1080/17538947.2018.1485754.
    [20] Cary G J, Keane R E, Gardner R H, et al. Comparison of the sensitivity of landscape-fire-succession models to variation in terrain, fuel pattern, climate and weather[J]. Landscape Ecology, 2006, 21(1): 121-137. DOI:  10.1007/s10980-005-7302-9.
    [21] Linn R, Winterkamp J, Edminster C, et al. Coupled influences of topography and wind on wildland fire behaviour[J]. International Journal of Wildland Fire, 2007, 16(2): 183-195. DOI:  10.1071/WF06078.
    [22] Forbes C, Evans M, Hastings N, et al. Statistical distributions[M]. New York: John Wiley & Sons, 2000. DOI: 10.1002/9780470627242.
    [23] Neill D B. Expectation-based scan statistics for monitoring spatial time series data[J]. International Journal of Forecasting, 2009, 25(3): 498-517. DOI:  10.1016/j.ijforecast.2008.12.002.
    [24] Tuia D, Ratle F, Lasaponara R, et al. Scan statistics analysis of forest fire clusters[J]. Communications in Nonlinear Science and Numerical Simulation, 2008, 13(8): 1 689-1 694. DOI:  10.1016/j.cnsns.2007.03.004.
    [25] Vadrevu K P. Analysis of fire events and controlling factors in eastern India using spatial scan and multivariate statistics[J]. Geografiska Annaler: Series A, Physical Geography, 2008, 90(4): 315-328. DOI:  10.1111/j.1468-0459.2008.00348.x.
  • [1] 李濤吳小平王瑩 . 基于分區空間掃描研究云南地區b值分布特征. 云南大學學報(自然科學版), 2010, 32(6): 670-675 .
    [2] 龔婧婧高茜管瑩李雪梅魏云林夭建華 . CHO細胞微核的激光掃描細胞儀自動化檢測方法. 云南大學學報(自然科學版), 2012, 34(4): 461-467,475.
    [3] 姚慶六 . 一類非線性三階兩點邊值問題的單調迭代方法. 云南大學學報(自然科學版), 2011, 33(1): 1-5,10 .
    [4] 姚慶六 . 一類非線性三階兩點邊值問題的單調迭代方法. 云南大學學報(自然科學版), 0, -1978(0): 0- .
    [5] 姚慶六 . 一類不連續三階兩點邊值問題的變號解. 云南大學學報(自然科學版), 2010, 32(2): 136-139, .
    [6] 姜躍 . 基于云有序概念層次樹的時間序列距離計算模型. 云南大學學報(自然科學版), 2003, 25(2): 115-120.
    [7] 尤衛紅趙付竹 . 夏季北太平洋副熱帶高壓年際變化的特征時間尺度及其時空演變. 云南大學學報(自然科學版), 2007, 29(1): 40-48.
    [8] 王曉霞楊樹政 . 兩維整體單極黑洞時空中的Casimir效應. 云南大學學報(自然科學版), 2007, 29(2): 145-151,155.
    [9] 陳欣木鈞楊群羽劉琨 . γ暴搜尋中實測角分布與角半徑的關系. 云南大學學報(自然科學版), 2004, 26(5): 413-416.
    [10] 程春玉孟捷 . 旅客到達昆明機場交通方式選擇影響因素分析. 云南大學學報(自然科學版), 2011, 33(S2): 333-336.
    [11] 曹良坤王昆山周燦東張 熹岳 燕楊艷華 . 基于Web的交通違法處理系統研究. 云南大學學報(自然科學版), 2014, 36(S2): 73-77. doi: 10.7540/j.ynu.2014a13
    [12] 許弟余焦善慶 . 對宇觀天體和微觀粒子質量-半徑統一計算的注記. 云南大學學報(自然科學版), 2002, 24(4): 282-286.
    [13] 和永軍姚慶華繆應鋒孫雪趙娜 . 基于大數據的云南省智慧城市交通建設研究. 云南大學學報(自然科學版), 2016, 38(S1): 50-. doi: 10.7540/j.ynu.2016d
    [14] 蒲斌李浩盧晨陽王治輝劉華 . 基于神經網絡的海量GPS數據交通流量預測. 云南大學學報(自然科學版), 2019, 41(1): 53-60. doi: 10.7540/j.ynu.20170292
    [15] 錢民唐克生 . 基于定性動態概率網絡的交通狀態預測及改進. 云南大學學報(自然科學版), 2012, 34(2): 165-168,176.
    [16] 張祖林劉光富 . 昆明市主城區道路交通控制與管理改進方案研究. 云南大學學報(自然科學版), 2009, 31(4): 346-351, .
    [17] 雷曉強 . 可分任務的完工時間. 云南大學學報(自然科學版), 2004, 26(2): 103-106.
    [18] 農慶琴陳智斌雷曉強 . 并行加工的完工時間. 云南大學學報(自然科學版), 2003, 25(2): 91-93.
    [19] 吳佳劉宏程呂亞瓊張玉順董澤民劉建平 . 赤霉素A環重排反應催化劑研究. 云南大學學報(自然科學版), 2005, 27(4): 352-356.
    [20] 劉建平 . 赤霉素類化合物中C,D環的重排反應研究Ⅰ:偶姻重排反應條件研究. 云南大學學報(自然科學版), 2002, 24(5): 366-369.
  • 加載中
圖(8)表(9)
計量
  • 文章訪問數:  419
  • HTML全文瀏覽量:  480
  • PDF下載量:  20
  • 被引次數: 0
出版歷程
  • 收稿日期:  2019-10-13
  • 錄用日期:  2020-02-20
  • 網絡出版日期:  2020-04-28
  • 刊出日期:  2020-07-01

基于時間距離的時空重排掃描優化方法

    作者簡介:楊 威(1992?),男,山西人,碩士生,研究方向為信息處理. E-mail:513079328@qq.com
    通訊作者: 龍華, longhua@kmust.edu.cn
  • 昆明理工大學 信息工程與自動化學院,云南 昆明 650500

摘要: 針對時空重排掃描方法掃描使用中,通過空間直線距離來測量兩觀測點間距會忽略城市中的樓房、公園等障礙物等因素,導致兩點間測得真實距離的偏差,從而對掃描結果造成影響, 提出了一種基于時間距離的時空重排掃描優化方法. 首先依據城市中障礙物對兩點間實際路徑的影響得到觀測點間的真實路徑,然后利用真實路徑計算得到兩觀測點間的交通時間,最后利用交通時間來代替表示兩點間的真實距離. 通過舊金山火災數據集對本文優化方法進行驗證,模型性能普遍提升了2%~5%.

English Abstract

  • 隨著近些年來時空數據日益增長,時空數據挖掘給公共事件預警與分析提供了參考與依據[1-2]. 其中,時空異常挖掘是時空數據挖掘中新興的一個領域,通過對時空數據所呈現異常特性的探測,從而挖掘其中所蘊含未知的知識,對相關領域發展提供幫助[1]. 例如在日常的交通擁堵中,交通管理部門可以根據時空異常有效地發現交通擁堵點,合理的安排車輛及行人出行[3];在氣象方面,氣象預報人員可以根據時空異常有效發現氣象災害分布情況,從而進一步深入判斷其發展規律,為下一步災害預測提供可靠依據[4];在對消防、犯罪及流行病等方面,預警人員通過對事件發生異常點進行檢測,根據其時空特性,對事件的發生進行預警[3]. 正因時空異常探測的巨大研究價值,近些年已成為時空數據挖掘的關鍵領域[5-8].

    在時空異常探測中,主要涉及以下兩種方法,分別是基于點數據異常挖掘和基于區域數據異常挖掘[9]. 基于點數據異常挖掘相較區域數據異常挖掘擁有更好的準確性,得到了更為廣泛的應用. 掃描統計方法是點數據異常挖掘的常用手段,通過劃定某一區域,計算該區域內某一類事件發生的次數與區域外事件發生次數的比值,并構造統計量,然后不斷改變劃定區域的范圍和位置,搜索整個研究范圍內統計量最大的區域,主要目的是探測和評估空間域或時空域內的聚集,從而解釋無法通過空間或時空隨機性解釋的問題. 1965年Naus首先提出空間掃描統計方法的概念,利用規定尺寸的矩形窗口在空間域上對集群進行掃描[10];此后Loader在此基礎上放寬了對矩形尺寸的限制[11]. Turnbull等提出了利用固定大小的圓形進行空間掃描的方法[12];Kulldorff等將固定大小的圓形掃描窗口擴展為可變大小的圓形掃描窗口,通過對圓形掃描窗口半徑的變化,來尋找空間域中擁有顯著性的圓形簇[13];2001年Kulldorff等在現有空間掃描統計方法的基礎上,進行了一個重要的擴展,在空間掃描統計方法上加入了時間參量,提出了時空掃描統計方法[14];2005年Kulldorff等的工作進一步擴展,為了減少對風險人口數的依賴性,提出了時空重排掃描方法[15]. 雖然,Kulldorff等對模型進行了不斷的修改,但是掃描窗口對于不規則大型實際數據集的探測仍有局限性.

    為了克服掃描窗口對大型不規則實際數據集探測的局限性問題,許多人員對掃描窗口進行了改進. 2015年Fanaee等提出了一種通過主空間和時間奇異向量中的異常元素的聯合組合,近似時空空間中熱點的方法[16]. 該方法與時空重排方法,利用對數似然比作為熱點識別的標準不同,采用了跟蹤空間和時間維度中,相關模式的變化來近似熱點位置的方法. 該方法雖然在單個異常點的檢測中具有較好的效果,但是在多異常點的檢測中效果較差. 2017年Ullah等為了解決掃描窗口對不規則形狀區域的掃描問題,提出了一種利用共聚類策略跟蹤時空事件結構變化的方法,這種方法通過跟蹤時空結構發生的變化進行異常探測,在一定程度上減少了形狀對掃描的限制[17]. 2018年Choi等提出了一種懲罰似然法,以克服現有的方法中,局部空間聚類方法的局限性[18]. 該方法在檢測局部空間聚類時,表現出很好的靈敏度和較高的特異性. 但是,該方法參數設置過多,會造成額外的計算量. 2019年Ktragadda等提出了一種利用多邊形傳播算法得到多邊形掃描統計量的方法[19]. 該方法利用多邊形傳播算法,對多個三角形組成的多邊形區域進行掃描,從而進行熱點檢測,較好的解決了實際研究區域的不規則問題. 但是該算法的時間復雜度與觀測數量均為非線性,對于較大的數據集而言,其不能很好地進行擴展.

    上述研究雖然都對時空掃描窗口形狀進行了改進,但沒有考慮研究區域內地形、房屋等外在因素對真實距離測量造成的偏差. 在進行時空掃描時,單純使用空間直線距離表示中心點與觀察點間距離,忽略了地形等外界因素對于事件傳播的影響[20-21],尤其在障礙物和人口較多的城市時空數據中,城市中的樓房、公園等障礙物都是不可忽略的重要因素,對這些因素的忽略都會造成最終掃描結果出現偏差.

    為了克服單純使用空間直線距離表示中心點與觀察點間距離的局限性問題,本文提出了一種基于空間兩點間交通時間作為兩點間距離的方法. 該方法可以歸納為3個步驟:①通過地圖工具獲取任意兩觀測點路徑距離;②根據路徑距離以及人流移動平均時間,計算量觀測點間交通時間;③根據研究區域內各觀測點間交通時間,判斷觀測點是否在掃描窗口內.

    本文的主要貢獻是基于單純使用空間直線距離表示中心點與觀察點間距離的缺陷,提出了一種基于空間兩點間交通時間作為兩點間距離的方法. 該方法通過計算空間兩點間的路徑距離,根據平均人流速度獲得空間兩點間交通時間,并將其作為空間兩點間真實距離. 通過此方法,可以將城市中的樓房、公園等障礙物等因素對掃描模型造成的影響加入到真實距離的計算中,從而提升掃描窗口獲取到觀測點的真實性.

    • 時空重排掃描方法[15]是由Kulldorff等在2005年基于時空掃描方法提出. 研究人員只需提前獲知事件發生數,不再需要風險人口數. 該方法令時空掃描方法在人口數據缺失情況下依舊可以使用,提升了時空掃描模型應用范圍.

      時空重排方法與時空掃描方法在原理上基本一致,均采用若干圓柱體柱面作為掃描窗口,從研究區域內尋找事件可能爆發的候選區域,其中圓柱底面大小代表潛在事件爆發的地理區域,底面中心為每一個觀測點,圓柱體的高度代表了所研究的時間閾值,為了避免過大的掃描半徑,通常將最大掃描半徑 $R$ 的上限設置為研究地理區域大小的50%所對應的圓形區域半徑. 時空重排掃描的示意圖如圖1所示.

      圖  1  時空重排掃描示意圖

      Figure 1.  Schematic diagram of space-time permutation scan statistic

      圖1中,設實心圓點表示發生的事件,空間點位置 $\left( {x,y} \right)$ 在研究區域內所映射的點由數值 $s$ 來標記,則在 $s \in \left\{ {\left. {1,2,\cdots,m,\cdots,n} \right\}} \right.,1 \leqslant m \leqslant n,n \in R$,$d \in \left\{ {1,2,\cdots,a,\cdots,D} \right\},1 \leqslant a \leqslant D,D \in R$ 的時空域內可以得到一個時空矩陣 ${{N}}$,其中,集合 $\left\{1,2,\cdots,\right. $$\left.m,\cdots,n\right\}$ 表示研究區域內的所有觀測點,集合 $d \in \left\{ {1,2,\cdots,a,\cdots,D} \right\}$ 表示研究時間閾值內所對應的日期,時空矩陣 ${{N}}$ 也可以由公式(1)表示.

      ${{N}} = [{n_{sd}}] = \left( {\begin{array}{*{20}{c}} {{n_{11}}}& \cdots &{{n_{1D}}} \\ \vdots & & \vdots \\ {{n_{n1}}}& \cdots &{{n_{nD}}} \end{array}} \right),$

      其中,${n_{11}},{n_{12}},\cdots,{n_{nD}}$ 代表了在日期 $d$ 內,觀測點 $s$ 處所發生的事件數.

      設2個觀測點 $i$$j$ 的坐標為 $\left( {{x_i},{y_i}} \right)$$\left( {{x_j},{y_j}} \right)$,則它們之間的距離為 ${L_{ij}}$,利用地圖的經緯度球面距離公式計算可以得到如公式(2)所示的空間距離矩陣 ${{L}}$,其中,由于距離的對稱性,則 ${L_{ij}} = {L_{ji}}, {L_{ii}} = $${L_{jj}} = 0;i = 1,2,\cdots,m,\cdots,n;j = 1,2,\cdots,m,\cdots,n;1 \leqslant m \leqslant n$,$n \in R $.

      ${{L}} = \left( {\begin{array}{*{20}{c}} 0& \cdots &{{L_{1n}}} \\ \vdots & & \vdots \\ {{L_{n1}}}& \cdots &0 \end{array}} \right),$

      其中,${L_{11}},{L_{12}},\cdots,{L_{nn}}$ 代表了集合 $\left\{ {\left. {1,2,\cdots,m,\cdots,n} \right\}} \right.$ 中任意兩點的空間距離.

      在研究區域規定時間間隔內觀察到的總事件數 $N$ 可以由公式(3)計算得到.

      $N = \sum\limits_s {\sum\limits_d {{n_{sd}}} } . $

      設所有觀測點 $s$ 上全時段的事件數為 ${n_s}$,指定時間段 $d$ 上所有觀測點的事件數為 ${n_d}$,其計算方法為:

      $ {{n_s} = \displaystyle\sum\limits_{d = 1}^D {{n_{sd}}} ,s \in \left\{ {\left. {{s_1},{s_2},\cdots,{s_m},\cdots,{s_n}} \right\}} \right.,} $

      ${{n_d} = \displaystyle\sum\limits_{s = 1}^{{S_n}} {{n_{sd}}} ,d \in \left\{ {1,2,\cdots,a,\cdots,D} \right\}. } $

      ${n_s}$${n_d}$ 是時空矩陣 ${{N}}$ 分別沿列和行值的累加和,稱為空間和時間上的邊緣累計和. 其中${n_{sd}}$ 是第 $d$ 天在觀察點 $s$ 處觀測到的事件數. 根據觀測值可以得到每一個觀測點每一天的事件數的期望 ${\mu _{sd}}$,并通過公式(6)計算得到.

      $\begin{split} {\mu _{sd}} =& \frac{{{n_d} \times {n_s}}}{N} = \frac{1}{N}\left( {\sum\limits_s {{n_{sd}}} } \right)\left( {\sum\limits_d {{n_{sd}}} } \right)= \\ &\frac{{\left( {\displaystyle\sum\limits_s {{n_{sd}}} } \right)\left( {\displaystyle\sum\limits_d {{n_{sd}}} } \right)}}{{\displaystyle\sum\limits_s {\displaystyle\sum\limits_d {{n_{sd}}} } }}. \end{split}$

      設圓柱體模型 ${\rm{H}}$ 的圓心是觀測點集合中的任意一個,半徑為 ${R_{\rm{H}}}$,則圖1中圓柱體 ${\rm{H}}$ 內預期的事件數 , ${\mu _{\rm{H}}}$就是該圓柱體內所有觀測點在研究時間內預期事件數的總和,其計算方法如公式(7)所示.

      ${\mu _{\rm{H}}} = \sum\limits_{\left( {s,d} \right) \in\rm H} {{\mu _{sd}}} . $

      假設在 $d$ 天中觀測到事件數的期望,在研究區域內對于任意的 $d$ 天都是相同的. 且 ${n_{\rm{H}}}$ 是觀測到的圓柱體 ${\rm{H}}$ 內的事件數. 在沒有發生時空交互時,${C_{\rm{H}}}$ 服從均值為 ${n_{\rm{H}}}$ 的超幾何分布[15],可以得到概率函數 $P\left( {{C_{\rm{H}}}} \right)$,其計算方法為:

      $P\left( {{C_{\rm{H}}}} \right) = {{\left(\!\! {\begin{array}{*{20}{c}} {\displaystyle\sum\limits_{s \in {\rm {H}}} {{n_{sd}}} } \\ {{n_{\rm {H}}}} \end{array}} \!\!\right)\left(\!\! {\begin{array}{*{20}{c}} {N - \displaystyle\sum\limits_{s \in {\rm{H}}} {{n_{sd}}} } \\ {\displaystyle\sum\limits_{d \in {\rm{H}}} {{n_{sd}} - {n_{\rm{H}}}} } \end{array}}\!\! \right)} \Bigg/ {\left(\!\! {\begin{array}{*{20}{c}} N \\ {\displaystyle\sum\limits_{d \in {\rm{H}}} {{n_{sd}}} } \end{array}}\!\! \right)}}.\!\!\!\!\!\!\! $

      $\displaystyle\sum\limits_{s \in {\rm{H}}} {{n_{sd}}}$$\displaystyle\sum\limits_{d \in {\rm{H}}} {{n_{sd}}}$$N$ 相對較小時,${n_{\rm{H}}}$ 可以近似為泊松分布,期均值為 ${\;\mu _{\rm{H}}}$[22]. 令 $G$ 是圓柱體的對數似然比,$I$ 是指示函數,這里用階躍信號表示,如果左側大于右側,則 $I = 1$,否則 $I = 0$. $G$ 的計算方式如:

      $G \!=\! \log {\left( {\dfrac{{{n_{\rm{H}}}}}{{{\mu _{\rm{H}}}}}} \right)^{{n_{\rm{H}}}}}{\left( {\dfrac{{N - {n_{\rm{H}}}}}{{N - {\mu _{\rm{H}}}}}} \right)^{\left( {N - {n_{\rm{H}}}} \right)}}I\left( {\dfrac{{{n_H}}}{{{\mu _{\rm{H}}}}} > \dfrac{{N - {n_{\rm{H}}}}}{{N - {\mu _{\rm{H}}}}}} \right). \!\!\!\!\!\!\!\!\!$

      對所有圓柱體的對數似然比進行比較,找到不可能偶然發生的時空集群作為可能發生事件爆發的候選區域.

      但在城市中,樓房、公園等障礙物以及人口流動都是不可忽略的重要因素,如果將這些因素都考慮到,則無法單純使用距離矩陣 ${{L}}$ 來表示集合 $\left\{ {\left. {1,2,\cdots,m,\cdots,n} \right\}} \right.$ 中任意兩點的距離.

    • 本研究針對單純使用距離矩陣 ${{L}}$ 來表示集合 $\left\{ {\left. {1,2,\cdots,m,\cdots,n} \right\}} \right.$ 中任意兩點的距離所帶來的缺陷,采用交通時間來表示中心點與觀察點間距離. 交通時間可以理解為從一個觀測點到達另外一個觀測點的實際消耗時間. 在實際應用中,令能對周圍其他事件造成影響的因素稱為事件因子. 那么當運動個體攜帶事件因子從一個觀測點抵達另一觀測點的途中,可能會經過房屋、山地、湖泊等障礙物,這些障礙物可能會對事件因子攜帶個體的移動路徑產生干擾. 所以,考慮到兩觀測點間障礙物等其他因素對距離測量干擾所得路徑距離為 ${D_{ij}}$.

      假設,事件因子攜帶個體在移動中遇到了k次障礙物,每次遇到障礙物時,事件因子攜帶個體會沿著通暢的路徑繼續移動,直到到達目標位置,其示意圖如圖2所示. 其中,虛線代表了 $i$$j$ 兩觀測點間的直線距離,實線代表了兩觀測點間事件因子攜帶個體所走的真實距離. 則兩點間的路徑距離 ${D_{ij}} =\displaystyle \sum\limits_k {{D_k}} ,k = 1,2,\cdots,u$,其中 ${D_k}$ 為事件因子每一次遇到障礙物改變方向后所經過的最短空間距離.

      圖  2  事件因子傳播路徑示意圖

      Figure 2.  Schematic diagram of the event factor propagation path

      當假設事件因子攜帶個體的移動速度同人的平均步行速度一致,且人步行移動的平均速度為 ${v_{{\rm{person}}}}$. 此處為了在體現以人類活動為主的城市環境中兩點間真實距離的同時,減小算法復雜度提升對模型運算速度的影響,所以事件因子攜帶個體移動速度采用人均步行移動速度. 那么,兩觀測點間的交通時間 ${T_{ij}}$ 的計算方法為:

      ${T_{ij}} = \frac{{{D_{ij}}}}{{{v_{{\rm{person}}}}}}. $

    • 通過結合交通時間計算方法,提出了一種基于時間距離的時空重排優化方法. 通過考慮障礙物等對于事件因子傳播的影響,利用交通時間重新構成距離矩陣,以達到優化時空重排掃描方法的目的.

      設兩個觀測點 $i$$j$ 的坐標為 $\left( {{x_i},{y_i}} \right)$$\left( {{x_j},{y_j}} \right)$,則它們之間的交通時間為 ${T_{ij}}$,利用地圖工具可以得到兩點間的步行距離以及步行時間,從而可以得到交通時間矩陣 ${{ T}}$,其計算方法如公式(11)所示. 其中,由于步行路徑的對稱性,則 ${T_{ij}} = {T_{ji}},{T_{ii}} = {T_{jj}} = $$ 0$,$i = 1,\,2,\,\cdots,\,m,\cdots,n;j = 1,\,2,\,\cdots,\,m,\,\cdots, n;\,1 \leqslant m \leqslant n,$$ n \in R$. 時空重排掃描優化方法的基本原理圖如圖3所示. 其中 ${T_{11}},{T_{12}},\cdots,{T_{SS}}$ 代表了集合 $\left\{1,2,\cdots,m,\cdots,\right. $$\left. n \right\}$ 中任意兩點的交通時間.

      圖  3  時空重排掃描優化方法基本原理圖

      Figure 3.  Basic schematic diagram of space-time permutation scan optimization method

      ${{T}} = \left( {\begin{array}{*{20}{c}} 0& \cdots &{{T_{1n}}} \\ \vdots & & \vdots \\ {{T_{n1}}}& \cdots &0 \end{array}} \right). $

    • 為了更好的評價距離矩陣 ${{ L}}$ 替換為交通距離矩陣 ${{ T}}$ 后,掃描圓柱體內事件總數 ${n_{\rm{H}}}$ 改變對模型性能的影響. 本文引入調和平均值 $F$ 作為目標函數[23],其計算方法為:

      $F = \frac{1}{{\dfrac{1}{{{S_{\rm{P}}}}} + \dfrac{1}{{{S_{\rm{R}}}}}}},$

      其中,${S_{\rm{P}}}$ 表示空間命中率,${S_{\rm{R}}}$ 表示空間精確度,其由公式(13)計算得出.

      $\left\{ {\begin{array}{*{20}{c}} {{S_{\rm{P}}} = \dfrac{{\left| {{Z^ * } \cap {Z_{{\rm{true}}}}} \right|}}{{\left| {{Z^ * }} \right|}},}\\ {{S_{\rm{R}}} = \dfrac{{\left| {{Z^ * } \cap {Z_{{\rm{true}}}}} \right|}}{{\left| {{Z_{{\rm{true}}}}} \right|}},} \end{array}} \right.$

      其中,${Z^ * }$ 表示通過時空重排掃描方法發現的預警點的個數,${Z_{{\rm{true}}}}$ 表示研究區域內確實爆發事件的點的個數.

      調和平均值 $F$ 通過權衡精確度和命中率之間的關系,避免了空間命中率和空間精確度單一評價指標對實驗結果進行評價產生的誤差.

    • 基于時間距離的時空重排優化算法的結果可通過以下步驟得到,算法流程圖如圖4所示.

      圖  4  時空重排掃描優化方法流程圖

      Figure 4.  Flow chart of space-time permutation scan optimization method

      步驟 1 獲取所研究地域內某一時段的案件發生數據,并生成時空矩陣 ${{ N}}$;

      步驟 2 利用地圖工具計算研究區域內觀測點之間的路徑距離 ${D_{ij}}$;

      步驟 3 根據研究區域內觀測點之間的路徑距離生成觀測點間的交通時間矩陣 ${{ T}}$;

      步驟 4 循環:從觀測點集 $\left\{ {\left. {1,2,\cdots,m,\cdots,n} \right\}} \right.$ 中依次選取觀測點作為掃描中心,掃描半徑遞增直至最大掃描半徑,對數據進行時空重排掃描,直至觀測點集 $\left\{ {\left. {1,2,\cdots,m,\cdots,n} \right\}} \right.$ 中的觀測點均作為掃描中心點時,掃描結束;

      步驟 5 獲取時空重排掃描結果.

    • 在現實中存在著大量時空數據,為了驗證優化方法的性能. 本研究采用舊金山地區數據協調網站DataSF(https://datasf.org/opendata/)提供的“Fire Department Service”數據作為實驗數據集,且已有研究人員在研究中證明火災事件可以作為時空事件進行研究[24-25]. 為了便于準確率和命中率的計算,這里提取2018年度的火災事件數據進行實驗. 并且為了方便時空重排掃描方法的使用,在實驗前對研究區域內的42個觀測點進行了編號,如表1所示. 并根據觀測地點、事件發生時間以及事件發生個數,對實驗數據集進行了整理,生成了便于時空重排掃描的數據集,如表2所示.

      地點名稱地點編號地點名稱地點編號
      Tenderloin1Outer Richmond8
      Mission2Inner Sunset9
      South of Market3Mission Bay10
      Haight Ashbury4Pacific Heights11
      Noe Valley5Parkside12
      North Beach6······
      Financial District7Seacliff42

      表 1  舊金山火災事件觀測地點編號

      Table 1.  Numbers of the fire incident observation site in San Francisco

      地點
      編號
      日期火災事件
      發生數
      地點
      編號
      日期火災事件
      發生數
      402018-01-01132018-01-011
      252018-01-01322018-01-013
      182018-01-01512018-01-011
      162018-01-011322018-01-011
      102018-01-011172018-01-011
      72018-01-015······
      42018-01-011272018-12-311

      表 2  時空重排掃描數據集

      Table 2.  Scanned data sets of the space–time permutation

      在本研究中,為了準確計算兩點間的交通時間. 采用谷歌地圖中的兩點間步行時間作為交通時間進行實驗.

    • 在實驗中,總共抽取了3個時間段的數據分別使用進行時空重排掃描方法與時空重排掃描優化方法進行實驗,并在用調和平均值 $F$ 作為目標函數來評價兩種方法的性能.

      分別選取2018年2月1日~2018年2月7日、2018年5月1日~2018年5月7日、2018年10月1日~2018年10月7日舊金山地區的火災事件作為時空重排掃描的掃描時間段. 研究區域空間大小50%所對應的圓形區域半徑作為時空重排掃描方法的最大掃描半徑[15],即10 km. 根據人步行的平均速率,時空重排掃描優化方法的最大掃描半徑為10 km所對應的步行時長125 min. 并將這3個時間段的第8日開始的7 d作為火災預警時間段,為了方便驗證,從數據集中提取2018年2月8日~2018年2月14日、2018年5月8日~2018年5月14日、2018年10月8日~2018年10月14日這3個時間段中42個觀測點的火災發生情況,如圖5所示. 從圖中觀察可以得到,2018年2月8日~2018年2月14日、2018年5月8日~2018年5月14日、2018年10月8日~2018年10月14日3個時間段的舊金山火災事件發生情況,如表3所示.

      時間實際發生火災事件的觀測點觀測點個數
      2018-2-8~2018-2-14 [1,2,3,4,6,7,8,9,10,11,12,13,14,16,17,18,19,20,21,22,23,24,25,27,28,29,30,32,33,35,36] 31
      2018-5-8~2018-5-14 [1,2,3,4,5,6,7,8,10,12,13,14,16,17,18,19,20,21,22,23,24,25,26,27,29,30,33,38,39] 29
      2018-10-8~2018-10-14 [1,2,3,4,6,7,8,9,10,11,12,13,14,15,16,17,18,20,21,22,23,24,26,28,29,30,31,32,33,34,36,37,39] 33

      表 3  實際發生火災的觀測點情況

      Table 3.  Observation points of actual fires

      圖  5  42個觀測點火災實際發生情況圖

      Figure 5.  Actual situation of fire at 42 observation points

      使用時空掃描重排傳統及優化方法對2018年2月1日~2018年2月7日的火災數據進行掃描,可以得到如圖6所示的掃描結果. 為了更好地表現實驗結果,在圖中用火焰圖標表示未預警到的火災發生點,用停止圖標表示預警到的火災發生點. 通過觀察圖6可得到如表4所示預警結果.

      掃描方法預警觀測點
      傳統方法 [2, 4, 5, 8, 9, 10, 12, 13, 14, 15, 17, 18, 22, 23, 24, 25, 26, 29, 30, 31, 32, 33, 34, 35, 38, 39, 40, 41, 42]
      優化方法 [1, 2, 3, 4, 5, 9, 10, 12, 13, 14, 15, 17, 18, 22, 23, 24, 25, 29, 30, 31, 32, 33, 35, 38, 40, 41, 42]

      表 4  2018年2月1日~2018年2月7日時空重排掃描方法預警觀測點

      Table 4.  Early warning observation points of the Space–Time Permutation Scanning method from February 1 to 7, 2018

      圖  6  2018年2月1日~2018年2月7日時空重排掃描方法掃描結果

      Figure 6.  Scanning results of the Space–Time Permutation Scanning method from February 1 to 7, 2018

      為了更好的表現對照結果,在圖6(b)中用黑色方框將與傳統掃描方式所得結果(圖6(a))不同的觀測點進行了標注. 通過觀察可以發現相較于傳統掃描方法,優化掃描方法通過采用新的距離測量手段探測到了1、3號觀測點,但8號觀測點被忽視,總體上增加了1個被命中的觀測點.

      使用時空掃描重排傳統及優化方法對2018年5月1日~2018年5月7日的火災數據進行掃描,可以得到如圖7所示的掃描結果. 為了更好地表現實驗結果,在圖中用火焰圖標表示未預警到的火災發生點,用停止圖標表示預警到的火災發生點. 通過觀察圖7可得到如表5所示預警結果.

      掃描方法預警觀測點
      傳統方法[1, 3, 8, 11, 13, 16, 18, 20, 21, 22, 24, 27, 31, 35, 36, 37, 38, 39, 40, 41, 42]
      優化方法[1, 3, 4, 7, 8, 9, 10, 11, 17, 18, 20, 21, 24, 26, 27, 28, 29, 34, 37, 39, 40, 41, 42]

      表 5  2018年5月1日~2018年5月7日時空重排掃描方法預警觀測點

      Table 5.  Early warning observation points of the Space–Time Permutation Scanning method from May 1 to 7, 2018

      圖  7  2018年5月1日~2018年5月7日時空重排掃描方法掃描結果

      Figure 7.  Scanning results of the Space–Time Permutation Scanning method from May 1 to 7, 2018

      為了更好的表現對照結果,圖7(b)中用黑色方框將與傳統掃描方式所得結果(圖7(a))不同的觀測點進行了標注. 通過觀察可以發現相較于傳統掃描方法,優化掃描方法通過采用新的距離測量手段探測到了4、7、10、17、26、29號觀測點,但16號觀測點被忽視,總體上增加了5個被命中的觀測點.

      使用時空掃描重排傳統及優化方法對2018年10月1日~2018年10月7日的火災數據進行掃描,可以得到如圖8所示的掃描結果. 為了更好地表現實驗結果,在圖中用火焰圖標表示未預警到的火災發生點,用停止圖標表示預警到的火災發生點. 通過觀察圖8可得到如表6所示預警結果.

      掃描方法預警觀測點
      傳統方法[1, 2, 3, 4, 6, 7, 8, 9, 11, 14, 15, 16, 17, 20, 21, 26, 27, 28, 29, 34, 35, 36, 37, 38, 39, 40, 41, 42]
      優化方法[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 17, 18, 20, 21, 25, 26, 27, 28, 29, 31, 34, 35, 36, 37, 39, 40, 41, 42]

      表 6  2018年5月1日~2018年5月7日時空重排掃描方法預警觀測點

      Table 6.  Early warning observation points of the Space–Time Permutation Scanning method from October 1 to 7, 2018

      圖  8  2018年10月1日~2018年10月7日時空重排掃描方法掃描結果

      Figure 8.  Scanning results of the Space–Time Permutation Scanning method from October 1 to 7, 2018

      為了更好的表現對照結果,圖8(b)中用黑色方框將與傳統掃描方式所得結果(圖8(a))不同的觀測點進行了標注. 通過觀察可以發現相較于傳統掃描方法,優化掃描方法通過采用新的距離測量手段探測到了10、12、18、31號觀測點,總體上增加了4個被命中的觀測點.

      根據上述實驗,可以得到這3組對比實驗所對應時空重排掃描方法與時空重排掃描優化方法的預警結果,根據預警結果與火災實際發生情況,可以計算得到兩種方法的命中率(${S\!_{\rm{P}}}$)、精確度(${S\!_{\rm{R}}}$)和調和平均值($F$),如表79所示.

      掃描方法評價指標傳統方法優化方法
      ${S\!_{\rm{P}}}$61.3%64.5%
      ${S\!_{\rm{R}}}$65.5%74.1%
      $F$ 0.316 0.345

      表 7  2018年2月1日~2018年2月7日2種方法掃描結果的 ${S\!_{\rm{P}}}$、${S\!_{\rm{R}}}$$F$

      Table 7.  ${S\!_{\rm{P}}}$, ${S\!_{\rm{R}}}$ and $F$ of the scanning results of the two methods from February 1 to 7, 2018

      掃描方法
      評價指標
      傳統方法優化方法
      ${S\!_{\rm{P}}}$44.8%51.7%
      ${S\!_{\rm{R}}}$61.9%65.2%
      $F$ 0.26 0.288

      表 8  2018年5月1日~2018年5月7日2種方法掃描結果的 ${S\!_{\rm{P}}}$、${S\!_{\rm{R}}}$$F$

      Table 8.  ${S\!_{\rm{P}}}$, ${S\!_{\rm{R}}}$ and $F$ of the scanning results of the two methods from May 1 to 7, 2018

      掃描方法
      評價指標
      傳統方法優化方法
      ${S\!_{\rm{P}}}$66.7%78.7%
      ${S\!_{\rm{R}}}$78.6%78.8%
      $F$ 0.361 0.393

      表 9  2018年10月1日~2018年10月7日2種方法掃描結果的 ${S\!_{\rm{P}}}$、${S\!_{\rm{R}}}$$F$

      Table 9.  ${S\!_{\rm{P}}}$, ${S\!_{\rm{R}}}$ and $F$ of the scanning results of the two methods from October 1 to 7, 2018

      根據表79的數據可以看出,在使用時空重排掃描優化方法進行實驗時,其 ${S\!_{\rm{P}}}$、${S\!_{\rm{R}}}$ 以及 $F$ 的值相對于時空重排掃描方法,都有了不同程度的提升,由此可以得出優化方法對時空重排掃描方法性能的提升是有效的.

    • 時空重排掃描方法是時空數據挖掘中時空異常探測的新興方法,在本研究中該方法用于短期時空事件的預警研究. 本研究的目的是通過考慮時空重排掃描時障礙物和人口較多的城市時空數據中,城市中的樓房、公園等障礙物等因素對于掃描方法性能的影響. 提出了一種基于空間兩點間交通時間作為兩點間距離的方法,經過試驗比對,使用本方法,模型的性能普遍提升了2%~5%,最終證明了在使用時空重排優化算法進行掃描時,模型的性能得到了提升.

      這項研究的重要性在于,通過使用交通時間作為兩點間距離,在掃描模型中增加了地形、房屋等阻礙物因素,使得掃描模型更加適用于實際數據的使用. 但是,在實際數據中,對于模型可能造成影響的因素還有很多,例如天氣因素、政策因素等,在以后的研究中,將會嘗試加入更多參考因素以進一步提升模型的有效性.

參考文獻 (25)

目錄

    /

    返回文章
    返回