Comment implémenter sklearns StratifiedKfold avec fastai ?

Question

Comment implémenter sklearns StratifiedKfold avec fastai ?

Demandé el 4 de Septembre, 2019: Quand la question a-t-elle été
928 affichage: Nombre de visites la question a
2 Réponses: Nombre de réponses aux questions
Résolu: Situation réelle de la question

Je participe à la compétition de kaggle APTOS 2019 et j'essaie d'assembler 5 plis, mais j'ai des problèmes avec l'implémentation correcte de StratifiedKFold.

J'ai essayé de googler sur les discussions fastai mais je ne vois pas de solutions. J'utilise la bibliothèque fastai et j'ai un modèle pré-entraîné.

def get_df():
    base_image_dir = os.path.join('..', 'input/aptos2019-blindness- 
    detection/')
    train_dir = os.path.join(base_image_dir,'train_images/')
    df = pd.read_csv(os.path.join(base_image_dir, 'train.csv'))
    df['path'] = df['id_code'].map(lambda x: 
    os.path.join(train_dir,'{}.png'.format(x)))
    df = df.drop(columns=['id_code'])
    df = df.sample(frac=1).reset_index(drop=True) #shuffle dataframe
    test_df = pd.read_csv('../input/aptos2019-blindness- 
    detection/sample_submission.csv')
    return df, test_df

df, test_df = get_df()

random_state = np.random.seed(2019)
skf = StratifiedKFold(n_splits=5, random_state=random_state, shuffle=True)

X = df['path']
y = df['diagnosis']

#getting the splits
for train_index, test_index in skf.split(X, y):
   print('##')
   X_train, X_test = X[train_index], X[test_index]
   y_train, y_test = y[train_index], y[test_index]
   train = X_train, y_train
   test = X_test, y_test
   train_list = [list(x) for x in train]
   test_list  = [list(x) for x in test]

data = (ImageList.from_df(df=df,path='./',cols='path') 
    .split_by_rand_pct(0.2) 
    .label_from_df(cols='diagnosis',label_cls=FloatList) 
    .transform(tfms,size=sz,resize_method=ResizeMethod.SQUISH,padding_mode='zeros') 
    .databunch(bs=bs,num_workers=4) 
    .normalize(imagenet_stats)  
   )

learn = Learner(data, 
            md_ef, 
            metrics = [qk], 
            model_dir="models").to_fp16()
learn.data.add_test(ImageList.from_df(test_df,
                             '../input/aptos2019-blindness-detection',
                                  folder='test_images',
                                  suffix='.png'))

Je souhaite utiliser les plis que j'ai obtenus à partir du fichier skf.split pour entraîner mon modèle, mais je ne suis pas sûr de savoir comment procéder.

Demandé el 4 de Septembre, 2019 par Benson Jin

Answer 1

2 Réponses

Answer 2

3voto

Harish Vutukuri Points 1097

Il y a deux façons de procéder.

Utiliser 'split_by_idxs' avec les index

data = (ImageList.from_df(df=df,path='./',cols='path')
    .split_by_idxs(train_idx=train_index, valid_idx=test_index) 
    .label_from_df(cols='diagnosis',label_cls=FloatList) 
    .transform(tfms,size=sz,resize_method=ResizeMethod.SQUISH,padding_mode='zeros') 
    .databunch(bs=bs,num_workers=4) 
    .normalize(imagenet_stats)  
   )

Utiliser 'split_by_list'

il = ImageList.from_df(df=df,path='./',cols='path')

data = (il.split_by_list(train=il[train_index], valid=il[test_index]) .label_from_df(cols='diagnosis',label_cls=FloatList) .transform(tfms,size=sz,resize_method=ResizeMethod.SQUISH,padding_mode='zeros') .databunch(bs=bs,num_workers=4) .normalize(imagenet_stats)
)

Répondu el 31 de Octobre, 2019 par Harish Vutukuri (1097 Points )

Answer 3

0voto

MD FARHAN Points 11

Voici un morceau de code. J'espère que cela vous aidera.

# creating a KFold object with 5 splits 
folds = KFold(n_splits = 5, shuffle = True, random_state = 10)

# specify range of hyperparameters
# Set the parameters by cross-validation
hyper_params = [ {'gamma': [1e-2, 1e-3, 1e-4],
                     'C': [5,10]}]

# specify model
model = SVC(kernel="rbf")

# set up GridSearchCV()
model_cv = GridSearchCV(estimator = model, 
                        param_grid = hyper_params, 
                        scoring= 'accuracy', 
                        cv = folds, 
                        verbose = 1,
                        return_train_score=True)      

# fit the model
model_cv.fit(X_train, y_train)

Répondu el 4 de Septembre, 2019 par MD FARHAN (11 Points )

Comment implémenter sklearns StratifiedKfold avec fastai ?

Réponses

Questions en vedette

Top Tags

Prograide.com

Powered by:

Comment implémenter sklearns StratifiedKfold avec fastai ?

Réponses

Questions en vedette

Top Tags

Dans notre réseau

Prograide.com

Powered by: