HDU 3065 病毒侵襲持續中 AC自動機

problem description

小t非常感謝大家幫忙解決了他的上乙個問題。然而病毒侵襲持續中。在小t的不懈努力下，他發現了網路中的「萬惡之源」。這是乙個龐大的病毒**，他有著好多好多的病毒，但是這個**包含的病毒很奇怪，這些病毒的特徵碼很短，而且只包含「英文大寫字元」。當然小t好想好想為民除害，但是小t從來不打沒有準備的戰爭。知己知彼，百戰不殆，小t首先要做的是知道這個病毒**特徵：包含多少不同的病毒，每種病毒出現了多少次。大家能再幫幫他嗎？

input

第一行，乙個整數n（1<=n<=1000），表示病毒特徵碼的個數。

接下來n行，每行表示乙個病毒特徵碼，特徵碼字串長度在1—50之間，並且只包含「英文大寫字元」。任意兩個病毒特徵碼，不會完全相同。

在這之後一行，表示「萬惡之源」**原始碼，原始碼字串長度在2000000之內。字串中字元都是ascii碼可見字元（不包括回車）。

output

按以下格式每行乙個，輸出每個病毒出現次數。未出現的病毒不需要輸出。

病毒特徵碼: 出現次數

冒號後有乙個空格，按病毒特徵碼的輸入順序進行輸出。

sample input3aa

bbcc

ooxxcc%daaaoen....end

sample output

aa: 2

cc: 1

hint

hit：

題目描述中沒有被提及的所有情況都應該進行考慮。比如兩個病毒特徵碼可能有相互包含或者有重疊的特徵碼段。

計數策略也可一定程度上從sample中推測。

其實該題沒有想象中的那麼複雜，仔細一想就知道，ac自動機自身不是有乙個重置操作嗎，即找的的子串曾經被我們刪除過，該題只要不進行刪除操作就行了，這都多虧了在該演算法中，本身的fail指標是不停的回溯的，例如aaa匹配aa時，前面的aa計算一次，到達第三個a時，由於後面的aa只有兩個字元，演算法將自動跳到aa的第二個a來匹配aaa中的第三個a，就是這樣。

**如下：

#include #include #include #include using namespace std;
char ss[1005][55], t[2000005];
int cnt[1005];
struct node
;void getstr( char *s )
node *init(  )
void buildtree( node *p, char *in, int no )
else
p->flag = no;
}void buildfailpoint( node *r )
f = f->fail;
}if( !f )
q.push( pos->ch[i] );
}}	}
}void acauto( node *r, char *text )
while( f )
f = f->fail;
}		if( !f )
f = r;
else
t = t->fail;
}}	}
}void _free( node *p )
free( p );
}int main()
buildfailpoint( r );
getstr( t );
acauto( r, t );
for( int i = 0; i < n; ++i )
_free( r );
}return 0;
}

HDU 3065 病毒侵襲持續中 AC自動機

hdu 3065 病毒侵襲持續中

HDU 3065 病毒侵襲持續中

HDU 3065 病毒侵襲持續中

相關推薦