update tokenizers

2025-06-10 17:01:28 -07:00
parent d99adcfb36
commit 4bac805093
4 changed files with 15 additions and 15 deletions
@@ -3,7 +3,7 @@ import random
 import inspect
 from typing import Dict, Any

-from transformers import AutoTokenizer
+from transformers import OpenAIGPTTokenizer
 import nltk

 from lib.data_types import ApiPayload, JsonDataException
@@ -11,7 +11,7 @@ from lib.data_types import ApiPayload, JsonDataException
 nltk.download("words")
 WORD_LIST = nltk.corpus.words.words()

-tokenizer = AutoTokenizer.from_pretrained("openai-community/openai-gpt")
+tokenizer = OpenAIGPTTokenizer.from_pretrained("openai-gpt")


@dataclasses.dataclass