社内文書等をデータベース化し、データベースの情報に基づいて応答する機能を備えたチャットシステムです。
データベースはユーザーが簡単に構築でき、AIが質問に関連する情報をデータベースから抽出し、データに基づき質問に沿った回答を生成します。
社内規定などをデータベース化すると、事務手続きに関する問い合わせ対応などにも活用できます。また、英語の資料であっても日本語で質問できるため、膨大な英語の資料の検索などにも活用できます。
その他、過去の資料から現状に合った情報の検索、過去の知見に基づいた新しい企画、作成した資料の事前チェック、膨大な資料の要約など、活用方法は無限大です。
WikipediaのONE PIECEのページをデータベース化したデモ映像です。
多くの情報から自然言語で関連情報を抽出し回答を生成することが出来ます。
データベース自体も自身のパソコン内に保存されるため、情報流出の心配がなく安心してお使いいただけます。
ニュース記事をデータベース化し、回答を生成するまでのデモ映像です。
特に特別な知識や操作なしにAI用のデータベースを構築できます。
テキストデータの他にも、Word、PDFといった様々なファイルタイプに対応しています。
以下のように、普段の会話から重要な情報を抽出することもできます。社内知識の共有に有効です。
会議の会話などを録音し、ギジロクで文字起こし
文字起こし結果をチャットプロでデータベース化
関連事項を質問すると、会話の内容を分析して回答を生成
「チャットプロ」は、RAG(検索拡張生成:Retrieval-Augmented Generation )と呼ばれる技術を使用しており、言語モデルが持つ情報に加えて、あらかじめ構築したデータベースを使用して回答を生成します。これにより、より確実で専門性の高い回答が得られます。
一方、「チャット」は言語モデルのみを使用しているため、②質問と⑤回答のみの動作で回答を生成します。一般的な回答はこちらで十分ですが、最新情報であったり、分野や会社内の情報が一般に公開されていない場合は「チャットプロ」の方が有効です。
動作確認用のお試し用です。こちらで動作を確認いただき、製品版の利用をご検討ください。
使用方法
zipファイルをローカルフォルダに解凍し、exeファイルをダブルクリックすると起動します。
注意事項
本ソフトウェアを保存するフォルダのパスには日本語を使用しないでください。
例:『C:\Users\マイコンピュータ\Desktop\Saporobo』のようにユーザー名などに日本語を使用している場合はエラーが発生します。『C:\Saporobo』のようにパスが英語名のみの場所に保存してください。
ソフトウェア起動時に一部のユーザーに警告が表示される可能性があります(現在対策中)。この「Windows によって PC が保護されました」という警告が表示されたときには、『詳細』をクリックし、『実行』をクリックしてください。
起動に失敗する場合はメモリ不足の可能性があります。パソコンの再起動、あるいは不要なアプリケーションを閉じた上で、再度ソフトウェアを起動してください。
初版リリース
モデルの変更
プロンプトの修正
デフォルトのベクトル検索数を変更
セキュリティ強化のため全ての通信を意図的に遮断
ネット経由で取得可能なファイルも全てローカルファイルとして格納
データベース作成ボタンを強調表示
テキストエンコードがUTF-8ではない場合にエラーが発生するバグ修正
データベースが無い状況でチャットを開始するとフリーズするバグ修正
ナレッジグラフデータベースを追加
ベクトルデータベースのみでも使用可
ベクトルデータベースを高機能なQdrantに変更
ベクトル検索とナレッジグラフ検索のフュージョン検索を追加(RSF Fusion RAG)
Rerankモデルを従来のものに加え、高機能モデルも追加(精度選択に応じて自動変更)
追加できるデータ種別にmp4を追加
Embedding modelを高性能モデルに変更
疎ベクトル検索モデルを高性能モデルに変更
メタデータフィルタリングのベース技術を実装(今後フィルタリング機能を追加予定)
並列処理による高速化
メモリ管理機能強化による高速化
回答をWordで出力する機能を追加
会話履歴削除ボタンの廃止
データベースリストの自動並べ替え機能追加
データベース作成画面で過去のデータベースを選択できる機能を追加
初期の回答生成モードをTree summarizeに変更
プログレスバーの色を変更
初期のCPU優先度を通常から低に変更
データベース構築中はデータベース設定画面を操作禁止に変更
AIモデルのパラメータ調整による高速化・高機能化
モデル固有のプロンプトフォーマットの改善
モデルに対する指示プロンプト全体の改善
テキストスプリッターの改善
トークナイザーの改善
メタデータ構造を最適化
データが格納されているフォルダ名が文書種別として登録される等
チャンクサイズをデータベースの種別ごとに調整
ベクトル検索時のハイブリッド検索パラメータを調整
過去のエラーログが削除されないバグを修正
選択したファイル(csv、md)がUTF-8以外だった場合エラーが発生するバグを修正
埋め込みモデルをONNXで高速化
処理中断ボタンを追加
プログラム異常遮断時の処理を強化
データベース作成失敗時の処理を強化
CPU優先度をNormalに変更
デフォルトのAI設定を変更
AIの並列処理パラメータを調整