質量與規模的發展:
這個是今天剛聽董事長在學院十年的什麼會議上的報告裡聽到的話:(簡化一下,因為不甚程式設計客棧重要,僅做引子)
我們jj學院,一直奉行質量與規模並發展的戰略,努力十年,從一無所有變成了現在的地位。有人說我們不重視質量,但是我想說有規模才有影響力,有規模才能真正去抓質量。在校發展到35000,可用資金有3個億,除開2個億的正常支出,還有乙個億可以夠我們支配,還有什麼事做不成?以前不是有個xx學院,一直奉行質量第一,抓質量抓的很厲www.cppcns.com害很出名,但是你看他現在,還是那麼個小學院,聽說連招個教師都招不到了(說著略微得意的笑了笑)。。(節選,能記住的有必要寫出來的大概就是這麼多了)
給我的可以聯絡到做**上的感想:
質量與規模不正是可以放到做站上面嗎?(稍微想一下,好象放哪都可以 )不正是可以用來辨證的看待採集的問題嗎?於是就大搖大擺的開始寫起來。
關採集於「質量與規模」的一些想法:
一直以來可能都有兩種比較明顯的對立的觀點,對於採集,有堅決不採集者(我是此類,長期人肉更新,所以感想可能更多)也有瘋狂的採集者。還有種兼而有之的做垃圾站瘋狂採集做正規站人肉更新等。
聯想到質量與規模,大概可以把人肉更新劃分到質量,有質量,重質量的範圍內,而採集就是迅速擴充**規模的象徵。(當然也並不排除有採集高手能採集到高質量的東西比別人人肉更新的還有效果 )
在開始做站的時候最重要的應該是搜尋引擎收錄吧。而搜尋引擎怎麼收錄你?在這個初期,我突然覺得採集堆砌式的大量資料的重大作用。(重點指**資訊多,包括但不限於只用採集)
想想看,就算你的站總共才只有10個頁面,就算全部收錄了又能如何?但是如果一上線便有1000個頁面,搜尋引擎的蜘蛛一爬起來會是怎麼樣?1000個頁面不斷的站內鏈結比10個頁面的站,在吸引蜘蛛的差別上是很大的,頁yjvmzadncl面夠多蜘蛛爬的越勤快,爬的越多收錄頁面越多,如此迴圈下去。在搜尋引擎的被收錄的頁面提上去了,無論如何都是有好處的。
這可以算是規模的在搜尋引擎的提公升吧,不僅可以利程式設計客棧用採集擴大自己**的規模增加搜尋引擎的收錄頁,更可以提公升**使用者的訪問體驗。
想想看,使用者開啟乙個**,看到版面空空,會有什麼想法?使用者正對你的**產生著濃厚興趣,突然發現居然把這個欄目甚至整個**都看完了會有什麼想法?就算你的內容是網上高度重複性的內容又如何?絕對也會有使用者對某些資訊是第一次在你這裡看到!再之,現在氾濫的技術完全允許你的**包含大量資訊而絲毫不影響使用者體驗。至多不過是資訊列表的分頁多一些而已。就像論壇的貼量,一般情況下幾頁以後的東西根本沒什麼人去關注,而能看到的不是通過搜尋引擎而來,就是屬於上者感興趣的使用者翻閱瀏覽。
而之於質量,如果僅僅是無限制的擴充**的規模最終講一事無成。好的**絕對離不開人肉更新,而且完全可程式設計客棧以說,**好的程度與人肉更新的積極度有著重大的關係。如果沒有勤奮積極的人肉更新,那與充斥氾濫的垃圾站又有何區別?相信更多的人都是擁有自己的乙個信念乙份興趣一點創意才加成為了乙個站長!至於如何抓質量,我相信大家肯定都早已有自己的想法。
總之,採集可以加快**的規模化,適當合理的採集絕對可以使**獲得很多好處。所以倡導「堅持不用採集的」、「還沒有使用過採集的」、「不會用採集的」的朋友們,稍微多花一點心思到採集上去,因為相對於採集的勞動產出比來說絕對是值得所有站長學習的。
最後「有規模才有影響力,有規模才能真正去抓質量。」應該是辨證的在看待採集的問題了。
本文標題: 質量與規模的發展—關於採集的一些想法
本文位址:
關於資料採集工作的一些感受
建工學院比較簡單,大家出現的人多問題我這裡都沒有。既沒有大三重新分專業,也沒有選修課,總之問題不多。加上建工學院的教學秘書也很負責,所以我的工作就更少。現在想想我我收穫了什麼呢?是與老師的協調嗎?張老師太盡職了,也不用和她多說什麼,該弄的都弄好了,出現的錯誤都不是原則上的錯誤。要說最大的收穫可能是再...
關於資訊採集中用到的一些點滴
在這裡記錄一下 使用如下的正規表示式來抽取乙個網頁下的所有鏈結,並 href url 測試字串 ddfa ddfa ddfa ddfa ddfa 採集網頁中所有的正規表示式 注意在正則中勾選case insensitive選項 測試字串 2 1還可以有這樣的鏈結http news.bjut.edu....
關於資訊採集中用到的一些點滴
在這裡記錄一下 使用如下的正規表示式來抽取乙個網頁下的所有鏈結,並 href url 測試字串 ddfa ddfa ddfa ddfa ddfa 採集網頁中所有的正規表示式 注意在正則中勾選case insensitive選項 測試字串 2 1還可以有這樣的鏈結http news.bjut.edu....