會議記錄轉文字 語音識別

2021-10-23 13:02:31 字數 1686 閱讀 5952

在工作中,對於一些重要的會議,參會內容需要記錄下來並整理成文字。隨著人工智慧的發展,我們考慮借助語音識別來提高效率。

針對本地語音檔案不得超過5mb的缺點,我們考慮採用大檔案分割的方式,將長錄音檔案分割成若干份不超過5mb的***檔案,進行逐個識別和校對。我們用python進行簡單的編寫來實現切割功能:

import os

# 函式file_split

# file_name : 原檔案

# split_size : 切割大小

deffile_split

(file_name, split_size)

:# 獲取絕對路徑

abs_file_name = os.path.abspath(file_name)

print

("原始檔 : "

+ abs_file_name)

# 獲取相對路徑, 檔名, 字尾

filepath, fullflname = os.path.split(abs_file_name)

fname, ext = os.path.splitext(fullflname)

try:

file_num =0;

# 開啟讀檔案

with

open

(abs_file_name,

"rb"

)as f :

while

true

: content = f.read(split_size)

ifnot content:

break

file_num +=

1 new_file_name = os.path.join(filepath, fname +

('_%04d'

%file_num)

+ ext)

# 迴圈寫檔案

with

open

(new_file_name,

"wb"

)as fw :

fw.write(content)

except

:print

("file read error!"

)# 主程式開始

file_name = r"d:\feitian\youtube\videoplayback01.***"

# 檔案切割大小:不到5mb(1m = 1024 * 1024)

split_size =5*

1000

*1000

# 呼叫函式

然後通過依次上傳的形式,可以依次得到識別的結果,並進行逐個校對,一般在所有都識別完之後,也基本上就校對完了。

綜上,如果費用充足,可以考慮直接購買現成的錄音產品進行體驗;如果有一定的程式設計能力,可以考慮體驗以下幾家雲平台的產品服務,選擇乙個相對簡便且功能強大的進行操作。

預計未來幾年,在雲平台語音識別的c端業務,幾家公司的競爭之處將在於,一方面怎麼提高檔案大小上限,另一方面怎麼減少使用者**量,降低sdk使用難度,完善使用者體驗。

4 27會議記錄

與會人員 武松樺 王亞正 詹元成 尹宇飛 張軍 王澤友 與會目的 專案選題再討論 專案前後端分工 會議概況 1.對老師敘述了專案大致功能 足球場地預約 賽事新聞發布查詢等等 後,老師認為題目離痛點仍然較遠。於是我們議定 若能在五一結束後,提出更加切中痛點 需求較高的詳細選題,則重新進行詳細精準的需求...

會議記錄及感想

老師真的很優秀,從言談舉止就可以看出。開會的時候,老師總是會根據每個人說的話去仔細的找每個人的優點,去找每個人閃光的地方。而且在給予意見的時候總是話語很溫柔。老師真的很棒,我感覺進了小組這麼久,好像就沒有老師解決不了的問題。每個人都會遇到各種各樣的問題,但是老師總能很輕鬆的給出解決方案。這就是見識,...

語音轉文字怎麼轉

很多人在工作中,不知道有沒有碰過要把語音檔案轉成文字的,小編最近在網上常常看到有人提這樣的問題,對於這種問題,很多人都不怎麼會,接下來小編告訴大家,語音轉文字怎麼轉的吧。使用工具 迅捷pdf轉換器 1 通常情況下,要把語音檔案轉成文字的話,都是需要用乙個轉換工具的,就比如pdf轉換器,可以在中 安裝...