train_test_split の書き方
from sklearn.model_selection import train_test_split as split x_train, x_test, y_train, y_test = split(iris.data,iris.target, train_size=0.85, test_size=0.15)
学習用データ,テスト用データ,学習用の正解ラベル, テスト用の正解ラベル = train_test_split(データ, データ正解ラベル,train_size=学習用データの割合,test_size=テスト用データの割合)
同時にシャッフルされる
ジェネレータで回したほうがメモリに優しい
from sklearn.model_selection import ShuffleSplit ss = ShuffleSplit(train_size=0.6, test_size=0.4, random_state=0)#インスタンス作成 train_index, test_index = next(ss.split(X))#6対4でnumpy.ndarrayのindex番号が作成される。
random_stateは、0を与えるといつも同じ乱数を発生