자연어 처리1 - Tokenizer
·
AI 공부
자연어 처리의 시작은 텍스트의 토큰화 입니다. 텍스트를 토큰화 하는 과정과 패딩과 임베딩에 대해서도 알아보겠습니다. 1. 텍스트의 토큰화import osos.environ['TF_ENABLE_ONEDNN_OPTS'] = '0'from tensorflow.keras.preprocessing.text import Tokenizerfrom tensorflow.keras.preprocessing.sequence import pad_sequencesfrom tensorflow.keras.models import Sequential, Modelfrom tensorflow.keras.layers import Embeddingimport numpy as np# 전처리할 텍스트를 정합니다.text = '오늘은 자연어 처..