記錄 自製閒聊機械人baseline

2021-10-24 10:08:12 字數 870 閱讀 9067

目錄

此文僅記錄整個對話系統專案的**step1–**製作乙個可以執行的baseline

之後再增添相應的功能 和完善專案整體

三、選擇處理方法

只是簡單的功能使用 具體涉及到的知識點 再開其他博文進行介紹 之後再貼鏈結於此文文末

加油吧~~~

目標:選擇內容合適、大小合適、目的相符的語料。大致還應該考慮是否做封閉語料還是open

切割、正則化:

(1)多餘的空格

(2)不正規的符號

(3)多餘的字元、英文

(1)正則化

(2)切分

(3)好壞語句判斷

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

import warnings

warnings.

filterwarnings

('ignore'

)import ssl

ssl._create_default_https_context = ssl._create_unverified_context

統一格式:

(1)原始文字不能直接訓練

(2)將句子轉換成向量

(3)將向量轉換成句子

data = pd.

read_csv

('')print

(data.

head()

)

該處使用的url網路請求的資料。

問答對的處理和拆分

語料模型的儲存

百度unit閒聊機械人

import json import random import requests client id 為官網獲取的ak,client secret 為官網獲取的sk client id hikc0fsxfqx17dgsbvcugyzx client secret wlun6dvlgjulnyvxt...

NAO機械人的幾個記錄

nao機械人一共有26個自由度,即26個控制電機,每乙個電機表現為乙個自由度 機械人可以看成是由連桿 link 和關節 jint 構成的 子連桿可以看成是通過關節連線到父連桿的,關節固定在父連桿上,子連桿的區域性座標建立在父連桿上,關節動作時將改變子連桿的位置。關節固定在父連桿上這句話是有問題的,應...

機械人搭建記錄 yobot Docker版本

官方教程使用 docker 自動指令碼部署 官方的一鍵指令碼 sudo bash c curl get.yobot.win bin bash set e 判斷執行環境 其實沒啥必要 輸入機械人使用者名稱和密碼,為方便後續配置 read p 請輸入作為機械人的qq號 qqid read p 請輸入作為...