目錄
此文僅記錄整個對話系統專案的**step1–**製作乙個可以執行的baseline
之後再增添相應的功能 和完善專案整體
三、選擇處理方法
只是簡單的功能使用 具體涉及到的知識點 再開其他博文進行介紹 之後再貼鏈結於此文文末
加油吧~~~
目標:選擇內容合適、大小合適、目的相符的語料。大致還應該考慮是否做封閉語料還是open
切割、正則化:
(1)多餘的空格
(2)不正規的符號
(3)多餘的字元、英文
(1)正則化
(2)切分
(3)好壞語句判斷
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.
filterwarnings
('ignore'
)import ssl
ssl._create_default_https_context = ssl._create_unverified_context
統一格式:
(1)原始文字不能直接訓練
(2)將句子轉換成向量
(3)將向量轉換成句子
data = pd.
read_csv
('')print
(data.
head()
)
該處使用的url網路請求的資料。
問答對的處理和拆分
語料模型的儲存
百度unit閒聊機械人
import json import random import requests client id 為官網獲取的ak,client secret 為官網獲取的sk client id hikc0fsxfqx17dgsbvcugyzx client secret wlun6dvlgjulnyvxt...
NAO機械人的幾個記錄
nao機械人一共有26個自由度,即26個控制電機,每乙個電機表現為乙個自由度 機械人可以看成是由連桿 link 和關節 jint 構成的 子連桿可以看成是通過關節連線到父連桿的,關節固定在父連桿上,子連桿的區域性座標建立在父連桿上,關節動作時將改變子連桿的位置。關節固定在父連桿上這句話是有問題的,應...
機械人搭建記錄 yobot Docker版本
官方教程使用 docker 自動指令碼部署 官方的一鍵指令碼 sudo bash c curl get.yobot.win bin bash set e 判斷執行環境 其實沒啥必要 輸入機械人使用者名稱和密碼,為方便後續配置 read p 請輸入作為機械人的qq號 qqid read p 請輸入作為...