在工作中,對於一些重要的會議,參會內容需要記錄下來並整理成文字。隨著人工智慧的發展,我們考慮借助語音識別來提高效率。
針對本地語音檔案不得超過5mb的缺點,我們考慮採用大檔案分割的方式,將長錄音檔案分割成若干份不超過5mb的***檔案,進行逐個識別和校對。我們用python進行簡單的編寫來實現切割功能:
import os
# 函式file_split
# file_name : 原檔案
# split_size : 切割大小
deffile_split
(file_name, split_size)
:# 獲取絕對路徑
abs_file_name = os.path.abspath(file_name)
print
("原始檔 : "
+ abs_file_name)
# 獲取相對路徑, 檔名, 字尾
filepath, fullflname = os.path.split(abs_file_name)
fname, ext = os.path.splitext(fullflname)
try:
file_num =0;
# 開啟讀檔案
with
open
(abs_file_name,
"rb"
)as f :
while
true
: content = f.read(split_size)
ifnot content:
break
file_num +=
1 new_file_name = os.path.join(filepath, fname +
('_%04d'
%file_num)
+ ext)
# 迴圈寫檔案
with
open
(new_file_name,
"wb"
)as fw :
fw.write(content)
except
:print
("file read error!"
)# 主程式開始
file_name = r"d:\feitian\youtube\videoplayback01.***"
# 檔案切割大小:不到5mb(1m = 1024 * 1024)
split_size =5*
1000
*1000
# 呼叫函式
然後通過依次上傳的形式,可以依次得到識別的結果,並進行逐個校對,一般在所有都識別完之後,也基本上就校對完了。
綜上,如果費用充足,可以考慮直接購買現成的錄音產品進行體驗;如果有一定的程式設計能力,可以考慮體驗以下幾家雲平台的產品服務,選擇乙個相對簡便且功能強大的進行操作。
預計未來幾年,在雲平台語音識別的c端業務,幾家公司的競爭之處將在於,一方面怎麼提高檔案大小上限,另一方面怎麼減少使用者**量,降低sdk使用難度,完善使用者體驗。
4 27會議記錄
與會人員 武松樺 王亞正 詹元成 尹宇飛 張軍 王澤友 與會目的 專案選題再討論 專案前後端分工 會議概況 1.對老師敘述了專案大致功能 足球場地預約 賽事新聞發布查詢等等 後,老師認為題目離痛點仍然較遠。於是我們議定 若能在五一結束後,提出更加切中痛點 需求較高的詳細選題,則重新進行詳細精準的需求...
會議記錄及感想
老師真的很優秀,從言談舉止就可以看出。開會的時候,老師總是會根據每個人說的話去仔細的找每個人的優點,去找每個人閃光的地方。而且在給予意見的時候總是話語很溫柔。老師真的很棒,我感覺進了小組這麼久,好像就沒有老師解決不了的問題。每個人都會遇到各種各樣的問題,但是老師總能很輕鬆的給出解決方案。這就是見識,...
語音轉文字怎麼轉
很多人在工作中,不知道有沒有碰過要把語音檔案轉成文字的,小編最近在網上常常看到有人提這樣的問題,對於這種問題,很多人都不怎麼會,接下來小編告訴大家,語音轉文字怎麼轉的吧。使用工具 迅捷pdf轉換器 1 通常情況下,要把語音檔案轉成文字的話,都是需要用乙個轉換工具的,就比如pdf轉換器,可以在中 安裝...