參加美賽的第二年,這次的比賽做起來比去年順利很多(隊友配合不錯),我在隊伍中擔任寫**的工具人,這次我們選的c題,c題比較符合我的方向,於是在開始比賽的第3個小時,經過討論,我們就定下來了題目為c題,大黃蜂(asian giant hornets)!
因為c題是乙個**+分析型別的題目,所以,我們先從資料開始入手;
lab status為negative的資料得佔總數的47.74%(2032/4256),positive佔0.33%(14/4256),unprocessed佔0.31%(13/4256),unverify得數目佔51.62%(2197/4256)。那就說明我們的訓練集數量很少,所以在訓練前我們得先做一下影象的處理,比如,影象的去噪和增強;資料集中有很多模糊的,所以對於該類我們有必要進行銳化和增強來提公升訓練效果。哎嗨,就在這時候,突然看到官方允許自己擴充樣本,這就很香了。
首先呢,我們知道這個蜂類的習性,根據官方提供的檔案,我們可以得知,30km築巢,8km活動,那麼我們可以從這乙個點,來根據時間的進行來**蜜蜂的走向;
由於是短時間內的**我們使用了svm結合gm-bp來進行**的過程;發現在8,9月活動比較頻繁,然後,我們將**的遷徙和實際的遷徙方向,分別做擬合,得到遷徙的方向夾角,得到評價**模型的評價函式。
我們將識別分為了兩個部分:
1.4.1 影象識別
兩個字:煉丹;
我們在這個題目中用的是cnn跑的,中間加了一些小track,最後達到了0.9的f1-score,網路結構等比賽結果出來詳細總結。
1.4.2 文字識別
1.4.3 動態更新係數
對於影象識別的結果和文字識別的結果,都是對於是否為胡蜂進行評價的,也就是說,是否為胡蜂的可能性,對於識別結果我們當然給他們規制乙個係數map,f1-score;對於結果進行線性回歸,來建立乙個動態的變化方程來**結果;
1.4.5 分類模型
我們將該模型分為三個通道:
通道1:如果資料為positive id,進入影象分類檢測模組,使用faster-rcnn對輸入的案件發生的「元凶」的**進行匹配檢測是否為胡蜂,如果為胡蜂,那模型將確認這是乙隻胡蜂,如果不是判斷為非胡蜂;
通道2:如果資料為negative id,進入影象分類檢測模組,使用faster-rcnn對輸入的案件發生的「元凶」的**進行匹配檢測是否為胡蜂,如果不為胡蜂,那模型將確認這不是乙隻胡蜂,如果是判斷為胡蜂;
通道3:當然,這個是乙個特殊情況,用來進行模型內部調解,如果通道1識別為negative id與開始輸入的positive id不一致,那麼進入parameter comparator模組,對於該 「案件」進行重新評分,根據文字分類和影象檢測得分進行判斷,當任意一方大的時候則服從該方的初始評判結果。
當然,最優秀的調查方案是要根據回歸方程對於是否為胡蜂的概率來進行評價的,在這裡,我們還可以對於胡蜂出現可能性最大的地點進行風險分析,來對於資源進行更好的調配來解決「重災區」,也就是在胡蜂出現的活動範圍中重疊分數較高的地區。
不多介紹,語文建模
好了,這也就是我最後一次的建模比賽,經過一年的修煉,國賽、中間的大大小小的建模比賽,再到這次的美賽,感慨其實還是挺多的,自己的編造水平還是提公升了不少(哈哈),也感謝隊友,就寫到這裡吧,等出成績後更新一下詳細的模型介紹。
2021美賽D題思路
團隊為建模國一獲得者,有豐富建模經驗,因為需保證建模思路的完整性,更新較慢,怕被d 新號。問題一 使用impact data資料集或其中的一部分來建立 影響力的 多個 定向網路,將影響者連線到追隨者。開發可捕獲此網路中 影響力 的引數。通過建立定向影響者網路的子網來探索 影響力的子集。描述此子網。您...
2021美賽建模 A題真菌思路
a題是研究不同種類的真菌在不同的內部 外部條件下,對枯枝落葉和木質纖維的分解作用的問題。題目中的一些重點為生長緩慢的真菌菌株往往能夠更好地在濕度和溫度等環境變化的情況下適應和生長,而生長較快的菌株往往對同樣的變化不那麼容易適應 生長速率和耐濕性與分解速率之間的關係 主要目標是在給定的土地上模擬木本纖...
2021美賽D題分析與思考
以 為主題的圖建模問題,可能需要一定的圖演算法 運籌 圖神經網路 圖資料庫 neo4.j nosql graph等 知識圖譜 這塊不算很了解只能算感覺 的基礎才能很好將問題落地 許多歌曲都有相似的旋律,許多藝術家對 流派的重大轉變做出了貢獻。有時,這些變化 是由於一位藝術家影響了另一位藝術家。有時,...