tiktoken さわった
ChatGPT API使用料の見積もりが欲しかったので、
トークン数を出してくれるOpenAIの公式ライブラリ
tiktoken を触りました。
自分でいじったところ、うまくいかなかったで
さくりとどなたかが作ったブツを拝借。
https://github.com/w95/tiktoken
使用手順は以下。Mac M1です
1. clone
2. VSCode にてdockerfile を build
3. 手順に書かれているdocker run を実行
4. iTerm から手順に書かれているcurlコマンド
4でうまくいかなかった(クオーテーションがえらっていて、dquote>プロンプトが出る)
ので、ctrl+c で curl を中止した後、ChatGPT GUI で聞いた。
curl と、「その後 dquote>が出る」と聞いたら、
正しい curl コマンドを出してくれた。
サンプルに載ってる curl は、なんか本文の「'」のエスケープが甘い?なんかよくわかんないんだけど(これもChatGPTに聞きます、いつか)
そしたら正しくCurlのレスポンスが返ってきた。
トークン数だけぺろっと出る。文字数は出ない。
次に、目的の日本語ドキュメントを読み込ませる。
また dquote> が出て、えらったので、再度
ChatGPTにcurlコマンドとdquote>が出た旨を聞く。
改行をエスケープもなしにしていたので、
改行を取り除いたcurlコマンドを返してくれた。
(こういう雑作業をやってくれるという用途もあるね。置換とかもできそう。)
そして、ついに本命の文字列の判定!
出た〜!
そして、GPT-3.5 は $0.0..2ということで、400トークンは20円かかんないくらいかな〜みたいな雑な見積もりをした。
それでも、まあお金かからない方法がいいよね、ってなって、いろいろ(Macで廉価版を動かしてみるとか、無料でできるサービスを酷使するとか...)
ちっちゃい仕事ですが、まさにChatGPTの強みをど真ん中に攻める仕事ができていて
人生は摩訶不思議アドベンチャーですね。