532 votes

Comment écrire trycatch dans R

Je veux écrire, trycatch le code d'erreur dans le téléchargement à partir du web.

url <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz")
y <- mapply(readLines, con=url)

Ces deux états exécuter avec succès. Ci-dessous, j'ai créer un non-existent web à l'adresse:

url <- c("xxxxx", "http://en.wikipedia.org/wiki/Xz")

url[1] n'existe pas. Comment écrit-on un trycatch boucle (function) de sorte que:

  1. Lorsque l'url est fausse, la sortie sera: "url web est faux, ne peuvent pas obtenir".
  2. Lorsque l'url est incorrecte, le code ne s'arrête pas, mais continue à télécharger jusqu'à la fin de la liste des url?

923voto

Rappster Points 2495

Alors: bienvenue dans le monde R ;-)

Ici, vous allez

Configuration du code de

urls <- c(
    "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
    "http://en.wikipedia.org/wiki/Xz",
    "xxxxx"
)
readUrl <- function(url) {
    out <- tryCatch(
        {
            # Just to highlight: if you want to use more than one 
            # R expression in the "try" part then you'll have to 
            # use curly brackets.
            # 'tryCatch()' will return the last evaluated expression 
            # in case the "try" part was completed successfully

            message("This is the 'try' part")

            readLines(con=url, warn=FALSE) 
            # The return value of `readLines()` is the actual value 
            # that will be returned in case there is no condition 
            # (e.g. warning or error). 
            # You don't need to state the return value via `return()` as code 
            # in the "try" part is not wrapped insided a function (unlike that
            # for the condition handlers for warnings and error below)
        },
        error=function(cond) {
            message(paste("URL does not seem to exist:", url))
            message("Here's the original error message:")
            message(cond)
            # Choose a return value in case of error
            return(NA)
        },
        warning=function(cond) {
            message(paste("URL caused a warning:", url))
            message("Here's the original warning message:")
            message(cond)
            # Choose a return value in case of warning
            return(NULL)
        },
        finally={
        # NOTE:
        # Here goes everything that should be executed at the end,
        # regardless of success or error.
        # If you want more than one expression to be executed, then you 
        # need to wrap them in curly brackets ({...}); otherwise you could
        # just have written 'finally=<expression>' 
            message(paste("Processed URL:", url))
            message("Some other message at the end")
        }
    )    
    return(out)
}

L'application du code

> y <- lapply(urls, readUrl)
Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html
Some other message at the end
Processed URL: http://en.wikipedia.org/wiki/Xz
Some other message at the end
URL does not seem to exist: xxxxx
Here's the original error message:
cannot open the connection
Processed URL: xxxxx
Some other message at the end
Warning message:
In file(con, "r") : cannot open file 'xxxxx': No such file or directory

Enquête sur la sortie

> head(y[[1]])
[1] "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">"      
[2] "<html><head><title>R: Functions to Manipulate Connections</title>"      
[3] "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\">"
[4] "<link rel=\"stylesheet\" type=\"text/css\" href=\"R.css\">"             
[5] "</head><body>"                                                          
[6] ""    

> length(y)
[1] 3

> y[[3]]
[1] NA

Remarques supplémentaires

tryCatch

tryCatch retourne la valeur associée à l'exécution d' expr moins qu'il y a une erreur ou un avertissement. Dans ce cas, les valeurs de retour (voir return(NA) ci-dessus) peut être spécifié en fournissant une fonction de gestionnaire (voir les arguments error et warning en ?tryCatch). Ceux-ci peuvent être des fonctions qui existent déjà, mais vous pouvez également définir dans tryCatch() (comme je l'ai fait ci-dessus).

Les implications du choix des valeurs de retour des fonctions de gestionnaire d'

Comme nous l'avons précisé qu' NA doit être retourné en cas d'erreur, le troisième élément en y est NA. Si nous aurions choisie NULL de la valeur de retour, la durée de l' y aurait juste été 2 au lieu de 3 comme lapply() aurez simplement à "ignorer" les valeurs de retour sont NULL. Notez également que si vous ne spécifiez pas explicite valeur de retour via return(), le gestionnaire de fonctions retournent NULL (c'est à dire dans le cas d'une erreur ou d'une condition d'alarme).

"Indésirable" message d'avertissement

En tant que warn=FALSE ne semble pas avoir d'effet, une autre façon de supprimer l'avertissement (qui dans ce cas n'est pas vraiment d'intérêt) est à utiliser

suppressWarnings(readLines(con=url))

au lieu de

readLines(con=url, warn=FALSE)

Plusieurs expressions

Notez que vous pouvez également placer plusieurs expressions dans la "expressions" (argument expr de tryCatch()) si vous les emballez dans des accolades (juste comme je l'ai illustré dans l' finally de la partie).

90voto

heretolearn Points 2515

R utilise des fonctions de mise en œuvre de bloc try-catch :

La syntaxe ressemble un peu à ceci :

Dans tryCatch(), il y a deux « conditions » qui peuvent être traitées : « avertissements » et des « erreurs ». La chose importante à comprendre lors de l’écriture de chaque bloc de code est l’état d’exécution et de la portée. @source

Prograide.com

Prograide est une communauté de développeurs qui cherche à élargir la connaissance de la programmation au-delà de l'anglais.
Pour cela nous avons les plus grands doutes résolus en français et vous pouvez aussi poser vos propres questions ou résoudre celles des autres.

Powered by:

X