problem description
小t非常感謝大家幫忙解決了他的上乙個問題。然而病毒侵襲持續中。在小t的不懈努力下,他發現了網路中的「萬惡之源」。這是乙個龐大的病毒**,他有著好多好多的病毒,但是這個**包含的病毒很奇怪,這些病毒的特徵碼很短,而且只包含「英文大寫字元」。當然小t好想好想為民除害,但是小t從來不打沒有準備的戰爭。知己知彼,百戰不殆,小t首先要做的是知道這個病毒**特徵:包含多少不同的病毒,每種病毒出現了多少次。大家能再幫幫他嗎?
input
第一行,乙個整數n(1<=n<=1000),表示病毒特徵碼的個數。
接下來n行,每行表示乙個病毒特徵碼,特徵碼字串長度在1—50之間,並且只包含「英文大寫字元」。任意兩個病毒特徵碼,不會完全相同。
在這之後一行,表示「萬惡之源」**原始碼,原始碼字串長度在2000000之內。字串中字元都是ascii碼可見字元(不包括回車)。
output
按以下格式每行乙個,輸出每個病毒出現次數。未出現的病毒不需要輸出。
病毒特徵碼: 出現次數
冒號後有乙個空格,按病毒特徵碼的輸入順序進行輸出。
sample input3aa
bbcc
ooxxcc%daaaoen....end
sample output
aa: 2
cc: 1
hint
hit:
題目描述中沒有被提及的所有情況都應該進行考慮。比如兩個病毒特徵碼可能有相互包含或者有重疊的特徵碼段。
計數策略也可一定程度上從sample中推測。
其實該題沒有想象中的那麼複雜,仔細一想就知道,ac自動機自身不是有乙個重置操作嗎,即找的的子串曾經被我們刪除過,該題只要不進行刪除操作就行了,這都多虧了在該演算法中,本身的fail指標是不停的回溯的,例如aaa匹配aa時,前面的aa計算一次,到達第三個a時,由於後面的aa只有兩個字元,演算法將自動跳到aa的第二個a來匹配aaa中的第三個a,就是這樣。
**如下:
#include #include #include #include using namespace std;char ss[1005][55], t[2000005];
int cnt[1005];
struct node
;void getstr( char *s )
node *init( )
void buildtree( node *p, char *in, int no )
else
p->flag = no;
}void buildfailpoint( node *r )
f = f->fail;
}if( !f )
q.push( pos->ch[i] );
}} }
}void acauto( node *r, char *text )
while( f )
f = f->fail;
} if( !f )
f = r;
else
t = t->fail;
}} }
}void _free( node *p )
free( p );
}int main()
buildfailpoint( r );
getstr( t );
acauto( r, t );
for( int i = 0; i < n; ++i )
_free( r );
}return 0;
}
hdu 3065 病毒侵襲持續中
題目大意及思路 ac自動機。include include include include include include include include include include includeusing namespace std define inf 0x3f3f3f3f define ...
HDU 3065 病毒侵襲持續中
這就更簡單了,都不用把out標記成false了 題目中的病毒都是大寫字母這個條件應該怎麼用?include include include include include include include include include include include include include ...
HDU 3065 病毒侵襲持續中
詢問每個模式串在文字傳中出現的次數。文字串中出現的字元不一定都是大寫字母,只需要在匹配的時候,對文字串進行特殊處理,將連續的大寫字母段當成合法的乙個文字串即可。然後 就是簡單的統計了。include include include include include include using name...