前段時間準備了資料,試了一下《基於attention model的aspect level文字情感分類--用python+keras實現》
這篇文章裡面的模型。
結果和文章裡差不多,驗證集準確率在75-80%左右。但仔細去看模型**的結果,這個資料其實並不好。剔除掉單個aspect的句子,多aspect句子**的準確率一點都不高。其中有大量的多個aspect但情感極性相同的情況,拉高了準確率。多aspect但情感極性不同時**結果只是略好於瞎猜。
我最終的目的能夠區分出乙個句子中,提到兩個aspect但是正負面極性不同的情況。
比如乙個句子包含ab兩個aspect,其中a應該是pos,b應該是neg,當前**的時候會把ab都**成pos或者都**為neg。極少數情況能夠區分出來。
而且哪怕是同樣的句式,即便能夠區分上面的句子,但換成c pos d neg,模型並不能完全習得並準確**出來。
當然啦,這個模型對**單個aspect句子的情感極性**效果非常非常好,還是很推薦的。
接下來我還是打算加lstm進去試一下,或者再折騰點別的。
2017.9.21
墩墩墩還是bilstm+attention效果好啊,看到我這篇的小夥伴可以跳過自己試驗的部分了。準確率穩穩的上85%。
接下來往裡面多加點資訊,但可以嘗試的東西太多了好難選擇。加點句子依存資訊,aspect相關的資訊,位置啊,文件資訊啥的吧?
2017.9.26
寄往遠方的情
淺淺的河水,如往昔一樣靜靜流淌,將一片枯葉輕放在水面,那蕩漾起的一陣漣漪,化作未來的情意,清晰 明亮。我將那來自明天的那抹情思,隨著枯葉,緩緩飄流,寄往遠方。歲月沉浮,又到寒冬,窗外細雨不絕,打濕了臨近心靈的那絲情愫,寒風陣陣,吹來了眼前的多愁苦悶的風景,我抬頭仰望那愈加昏暗的天空,想著這生活是有點...
提高班的兄弟情
這兩年,最常在的地方是機房,見的最多的是機房的兄弟姐妹。寒暑假更是。我們生活 學習在一起。可以學習時一塊 玩笑時一塊打鬧。提高班情誼就這樣慢慢的培養起來。我們這些互不相識,距離甚遠的人能相聚在廊坊,又因為志同道合而聚到提高班,真的很有緣分。落地為兄弟,何必骨肉親。出門在外,遠離家鄉,我們這些人真的可...
swift get請求action亂碼的情況
swift,後台action都是utf 8編碼格式,但是在後台取引數的時候,中文亂碼,我在傳送的時候確認用utf 8格式傳送 varencodcolname string colname stringbyaddingpercentescapesusingencoding nsutf8stringen...