Exportando dados de R: como exportar dados de R para CSV, Excel

Como exportar dados de R

Neste tutorial, aprenderemos como exportar dados do ambiente R para diferentes formatos.

Para exportar dados para o disco rígido, você precisa do caminho do arquivo e de uma extensão. Em primeiro lugar, o caminho é o local onde os dados serão armazenados. Neste tutorial, você verá como armazenar dados em:

  • O disco rígido
  • Google Drive
  • Dropbox

Em segundo lugar, R permite que os usuários exportem os dados para diferentes tipos de arquivos. Cobrimos a extensão do arquivo essencial:

  • csv
  • xlsx
  • RDS
  • SAS
  • SPSS
  • ERA

No geral, não é difícil exportar dados de R.

Neste tutorial, você aprenderá-

Exportar para disco rígido

Para começar, você pode salvar os dados diretamente no diretório de trabalho. O código a seguir imprime o caminho do diretório de trabalho:

directory <-getwd() directory

Saída:

## [1] '/Users/15_Export_to_do' 

Por padrão, o arquivo será salvo no caminho abaixo.

Para Mac OS:

/Users/USERNAME/Downloads/ 

Para Windows:

C:UsersUSERNAMEDocuments

Você pode, é claro, definir um caminho diferente. Por exemplo, você pode alterar o caminho para a pasta de download.

Criar quadro de dados

Em primeiro lugar, vamos importar o conjunto de dados mtcars e obter a média de mpg e disp agrupados por equipamento.

 library(dplyr) df % select(mpg, disp, gear) % > % group_by(gear) % > % summarize(mean_mpg = mean(mpg), mean_disp = mean(disp)) df 

Saída: :

 ## # A tibble: 3 x 3 ## gear mean_mpg mean_disp ## lt;dbl> ## 1 3 16.10667 326.3000 ## 2 4 24.53333 123.0167 ## 3 5 21.38000 202.4800

A tabela contém três linhas e três colunas. Você pode criar um arquivo CSV com a função write.csv em R.

Como exportar um DataFrame para um arquivo CSV em R

A sintaxe básica de write.csv em R para exportar o DataFrame para CSV em R:

write.csv(df, path) arguments -df: Dataset to save. Need to be the same name of the data frame in the environment. -path: A string. Set the destination path. Path + filename + extension i.e. '/Users/USERNAME/Downloads/mydata.csv' or the filename + extension if the folder is the same as the working directory

Exemplo:

write.csv(df, 'table_car.csv')

Explicação do código

  • write.csv (df, 'table_car.csv'): Crie um arquivo CSV no disco rígido:
    • df: nome do quadro de dados no ambiente
    • 'table_car.csv': Nomeie o arquivo table_car e armazene-o como csv

Observação : Você pode usar a função write.csv em R como write.csv2 () para separar as linhas com um ponto e vírgula para R exportar para dados csv.

write.csv2(df, 'table_car.csv')

Observação : Apenas para fins pedagógicos, criamos uma função chamada open_folder () para abrir a pasta do diretório para você. Você só precisa executar o código abaixo e ver onde o arquivo csv está armazenado. Você deve ver um nome de arquivo table_car.csv para a exportação de dados R para csv.

 # Run this code to create the function open_folder <-function(dir){ if (.Platform['OS.type'] == 'windows'){ shell.exec(dir) } else { system(paste(Sys.getenv('R_BROWSER'), dir)) } } # Call the function to open the folder open_folder(directory)

Como exportar dados do arquivo R para o Excel

Agora, aprenderemos como exportar dados de R para Excel:

Exportar dados de R para Excel é trivial para usuários do Windows e mais complicado para usuários do Mac OS. Ambos os usuários usarão a biblioteca xlsx para criar um arquivo Excel. A ligeira diferença vem da instalação da biblioteca. Na verdade, a biblioteca xlsx usa Java para criar o arquivo. O Java precisa ser instalado se não estiver presente em sua máquina para exportar o Data R para o Excel.

Usuários do Windows

Se você for um usuário do Windows, poderá instalar a biblioteca diretamente com conda para exportar dataframe para o excel R:

conda install -c r r-xlsx

Depois de instalar a biblioteca, você pode usar a função write.xlsx (). Uma nova pasta de trabalho do Excel é criada no diretório de trabalho para R exportar para dados do Excel

 library(xlsx) write.xlsx(df, 'table_car.xlsx')

Se você for um usuário do Mac OS, precisará seguir estas etapas:

  • Etapa 1: instale a versão mais recente do Java
  • Etapa 2: instalar a biblioteca rJava
  • Etapa 3: instalar a biblioteca xlsx

Passo 1) Você pode baixar o Java do site oficial da Oracle e instalá-lo.

Você pode voltar ao Rstudio e verificar qual versão do Java está instalada.

system('java -version')

No momento do tutorial, a versão mais recente do Java é 9.0.4.

Passo 2) Você precisa instalar o rjava em R. Recomendamos que você instale R e Rstudio com Anaconda. O Anaconda gerencia as dependências entre as bibliotecas. Nesse sentido, o Anaconda irá lidar com os meandros da instalação do rJava.

Primeiro de tudo, você precisa atualizar o conda e, em seguida, instalar o biblioteca . Você pode copiar e colar as próximas duas linhas de código no terminal.

 conda - conda update conda install -c r r-rjava 

Em seguida, abra marrom em Rstudio

library(rJava)

Etapa 3) Finalmente, é hora de instalar o xlsx. Mais uma vez, você pode usar conda para fazer:

conda install -c r r-xlsx

Assim como os usuários do Windows, você pode salvar dados com a função write.xlsx ()

library(xlsx)

Saída:

## Loading required package: xlsxjars
write.xlsx(df, 'table_car.xlsx')

Exportando dados de R para software diferente

Exportar dados para um software diferente é tão simples quanto importá-los. A biblioteca 'paraíso' fornece uma maneira conveniente de exportar dados para

  • spss
  • sas
  • era

Em primeiro lugar, importe a biblioteca. Se você não tem 'porto', você pode ir aqui para instalá-lo.

library(haven) 

Arquivo SPSS

Abaixo está o código para exportar os dados para o software SPSS:

write_sav(df, 'table_car.sav') 

Exportando dados de R para arquivo SAS

Tão simples quanto spss, você pode exportar para sas

write_sas(df, 'table_car.sas7bdat')

Como exportar dados de R para arquivo STATA

Finalmente, a biblioteca de Haven permite a gravação de arquivos .dta.

write_dta(df, 'table_car.dta')

R

Se você deseja salvar um quadro de dados ou qualquer outro objeto R, você pode usar a função save ().

save(df, file ='table_car.RData')

Você pode verificar os arquivos criados acima no diretório de trabalho atual

Interaja com os serviços em nuvem

Por último, mas não menos importante, R está equipado com bibliotecas fantásticas para interagir com os serviços de computação em nuvem. A última parte deste tutorial trata da exportação / importação de arquivos de:

  • Google Drive
  • Dropbox

Observação : Esta parte do tutorial pressupõe que você tenha uma conta no Google e no Dropbox. Caso contrário, você pode criar um rapidamente para - Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h

Google Drive

Você precisa instalar a biblioteca googledrive para acessar a função que permite interagir com o Google Drive.

A biblioteca ainda não está disponível no Anaconda. Você pode instalá-lo com o código abaixo no console.

install.packages('googledrive') 

e você abre a biblioteca.

library(googledrive)

Para usuários não conda, a instalação de uma biblioteca é fácil, você pode usar a função install.packages ('NOME DO PACOTE) com o nome do pacote entre parênteses. Não se esqueça do ''. Note que, supõe-se que R deve instalar o pacote no `libPaths () automaticamente. Vale a pena ver isso em ação.

Upload para o Google Drive

Para fazer upload de um arquivo para o Google drive, você precisa usar a função drive_upload ().

Cada vez que reiniciar o Rstudio, você será solicitado a permitir o acesso tidyverse ao Google Drive.

A sintaxe básica de drive_upload () é

drive_upload(file, path = NULL, name = NULL) arguments: - file: Full name of the file to upload (i.e., including the extension) - path: Location of the file- name: You can rename it as you wish. By default, it is the local name. 

Depois de iniciar o código, você precisa confirmar várias perguntas

drive_upload%<('table_car.csv', name ='table_car')

Saída:

 ## Local file: ## * table_car.csv ## uploaded into Drive file: ## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk ## with MIME type: ## * text/csv

Você digita 1 no console para confirmar o acesso

Em seguida, você é redirecionado para a API do Google para permitir o acesso. Clique em Permitir.

Assim que a autenticação for concluída, você pode sair do navegador.

No console do Rstudio, você pode ver o resumo da etapa realizada. O Google carregou com sucesso o arquivo localizado localmente no Drive. O Google atribuiu um ID a cada arquivo na unidade.

Você pode ver este arquivo na planilha do Google.

drive_browse('table_car')

Saída:

Você será redirecionado para a planilha do Google

Importar do Google Drive

Fazer upload de um arquivo do Google Drive com o ID é conveniente. Se você souber o nome do arquivo, poderá obter seu ID da seguinte forma:

Observação : Dependendo da sua conexão com a Internet e do tamanho do seu Drive, isso pode demorar.

 x <-drive_get('table_car') as_id(x)

Você armazenou o ID na variável x. A função drive_download () permite baixar um arquivo do Google Drive.

A sintaxe básica é:

drive_download(file, path = NULL, overwrite = FALSE) arguments: - file: Name or id of the file to download -path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive -overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Finalmente, você pode baixar o arquivo:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Explicação do código

  • drive_download (): Função para baixar um arquivo do Google Drive
  • as_id (x): Use o ID para navegar pelo arquivo no Google Drive
  • overwrite = TRUE: se o arquivo existir, substitua-o; caso contrário, a execução será interrompida. Para ver o nome do arquivo localmente, você pode usar:

Saída:

O arquivo é armazenado em seu diretório de trabalho. Lembre-se, você precisa adicionar a extensão do arquivo para abri-lo em R. Você pode criar o nome completo com a função paste () (ou seja, table_car.csv)

 google_file <-download_google$local_path google_file path <-paste(google_file, '.csv', sep = '') google_table_car <-read.csv(path) google_table_car

Saída:

 ## X gear mean_mpg mean_disp ## 1 1 3 16.10667 326.3000 ## 2 2 4 24.53333 123.0167 ## 3 3 5 21.38000 202.4800 

Finalmente, você pode remover o arquivo do seu Google Drive.

## remove file drive_find('table_car') %>%drive_rm()

Saída:

É um processo lento. Demora para deletar

Exportar para Dropbox

R interage com o Dropbox por meio da biblioteca rdrop2. A biblioteca também não está disponível no Anaconda. Você pode instalá-lo por meio do console

install.packages('rdrop2')
library(rdrop2)

Você precisa fornecer acesso temporário ao Dropbox com sua credencial. Após a identificação ser feita, R pode criar, remover upload e download para o seu Dropbox.

Em primeiro lugar, você precisa dar acesso à sua conta. As credenciais são armazenadas em cache durante toda a sessão.

drop_auth()

Você será redirecionado para o Dropbox para confirmar a autenticação.

Você receberá uma página de confirmação. Você pode fechá-lo e voltar para R

Você pode criar uma pasta com a função drop_create ().

  • drop_create ('my_first_drop'): Crie uma pasta na primeira ramificação do Dropbox
  • drop_create ('First_branch / my_first_drop'): Crie uma pasta dentro da pasta First_branch existente.
drop_create('my_first_drop')

Saída:

No DropBox

Para enviar o arquivo .csv para o seu Dropbox, use a função drop_upload ().

Sintaxe básica:

 drop_upload(file, path = NULL, mode = 'overwrite') arguments: - file: local path - path: Path on Dropbox - mode = 'overwrite': By default, overwrite an existing file. If set to `add`, the upload is not completed. 
drop_upload('table_car.csv', path = 'my_first_drop')

Saída:

No DropBox

Você pode ler o arquivo csv do Dropbox com a função drop_read_csv ()

dropbox_table_car <-drop_read_csv('my_first_drop/table_car.csv') dropbox_table_car

Saída:

## X gear mean_mpg mean_disp ## 1 1 3 16.10667 326.3000 ## 2 2 4 24.53333 123.0167 ## 3 3 5 21.38000 202.4800 

Quando terminar de usar o arquivo e quiser excluí-lo. Você precisa escrever o caminho do arquivo na função drop_delete ()

drop_delete('my_first_drop/table_car.csv')

Saída:

Também é possível excluir uma pasta

drop_delete('my_first_drop')

Saída:

Resumo

Podemos resumir todas as funções na tabela abaixo

Biblioteca

Objetivo

Função

base

Exportar csv

write.csv ()

xlsx

Exportar excel

write.xlsx ()

refúgio

Exportar spss

write_sav ()

refúgio

Exportar sas

write_sas ()

refúgio

A exportação foi

write_dta ()

base

Exportar R

Salve ()

Google Drive

Faça upload do Google Drive

drive_upload ()

Google Drive

Abra no Google Drive

drive_browse ()

Google Drive

Recuperar ID do arquivo

drive_get (as_id ())

Google Drive

Dowload do Google Drive

download_google ()

Google Drive

Remover arquivo do Google Drive

drive_rm ()

rdrop2

Autenticação

drop_auth ()

rdrop2

Crie uma pasta

drop_create ()

rdrop2

Upload para Dropbox

drop_upload ()

rdrop2

Leia csv no Dropbox

drop_read_csv

rdrop2

Excluir arquivo do Dropbox

drop_delete ()