Arquivos de Dados

Leitura de Arquivos Ferramentas Download Analises de Variância Agrupamentos Correlações
Testes Estatisticos Multivariadas Qualidade Regressões Sobrevivência Univariadas Livro

Arquivos do Usuário

Para usar o SAEG é necessário que exista um arquivo contendo os dados a serem analisados, chamado "Arquivo de dados brutos". Este arquivo pode ser construído com o uso de qualquer editor de textos que grave dados no padrão ASCII ou com o uso do "Excel" "Lotus" ou "Dbase" ou qualquer outro programa que grave arquivos nos padrões desses produtos.

 

Padrão

Tipo do arquivo

Extensão do arquivo

Texto

Texto formatado

TXT

Excel

XLS

XLS

Lotus

WK1 (1-2-3)

WK1

Dbase

DBF-3

DBF

 

Arquivos Gerados por Editores de Texto

Os campos ou as variáveis devem ser representados nas colunas e as observações nas linhas, conforme exemplos a seguir:

 

QUEST

SEXO

LOCAL

RENDA

01

1

1

96.42

02

1

2

108.32

03

2

1

243.62

04

1

3

143.25

05

1

2

.

06

2

3

148.72

07

1

2

328.25

.

.

.

.

.

.

.

.

. . . .

Neste exemplo QUEST representa o nome da variável questionário; SEXO, o sexo do entrevistado; LOCAL, a origem do entrevistado e RENDA, a sua renda mensal.

Pode-se observar neste pequeno exemplo as restrições do SAEG em relação a dados:

a) Os nomes das variáveis devem ser compostos de no máximo oito dígitos, começando obrigatoriamente por uma letra e não poderão conter caracteres especiais do tipo ‘+’, ‘-’ , ‘/’ , ‘x’, ‘^’.

b) O número de variáveis não poderá ser maior que 500.

c) Os valores de dados devem ser, obrigatoriamente, numéricos.

d) O ponto decimal deve ser usado em lugar da vírgula.

e) Não existe restrição ao número de observações.

1.1 - Texto Não-Formatado

No exemplo abaixo, na primeira linha, foram colocados os nomes das variáveis. Esta é uma opção especial de construção do arquivo de dados, normalmente usada para arquivos que contêm poucas variáveis (até 80).

 

NIVEL ESCOLA EXPER ESFMEN ESFFIS RESP1 RESP2 RESP3 AMBIENTE RISCOS SALARIO

01 1 1 1 3 1 1 1 3 2 185

02 2 2 1 2 2 2 1 1 1 227

03 2 1 1 3 2 2 1 3 1 235

04 2 1 1 3 1 3 2 3 3 258

05 1 2 2 3 1 2 2 3 3 263

06 2 3 2 3 1 1 2 3 2 268

07 2 2 2 2 2 4 1 2 2 283

08 2 2 2 3 2 3 2 5 4 315

09 2 4 3 3 2 1 1 3 2 332

10 2 3 2 3 3 4 2 3 3 340

11 2 4 2 3 3 3 1 3 2 343

12 3 3 3 4 2 2 1 4 3 351

13 2 5 3 3 3 3 2 3 3 404

14 4 5 3 1 3 2 1 1 1 425

15 3 4 2 3 3 4 3 3 4 456

16 3 5 5 2 3 3 1 3 3 466

17 3 5 2 4 4 3 1 5 4 472

18 3 5 2 4 4 3 1 5 4 478

19 4 4 3 3 3 5 2 4 3 489

20 3 5 3 4 4 3 2 4 4 497

21 3 5 4 2 2 3 1 3 2 507

22 4 4 3 4 3 4 3 4 4 520

23 4 5 4 4 4 4 1 4 4 582

24 4 5 4 4 4 4 2 4 4 596

25 4 5 4 4 4 4 2 4 4 598

26 5 5 4 3 4 4 1 2 2 645

27 5 5 5 1 4 4 1 2 2 648

28 5 6 4 4 3 3 3 3 2 704

29 5 5 4 5 4 4 2 3 4 706

30 5 5 5 2 4 4 1 3 3 723

31 5 6 5 1 5 2 1 1 1 737

32 5 6 5 3 4 6 1 2 4 754

33 6 6 5 2 4 5 1 3 3 873

34 6 6 5 1 4 3 1 1 1 902

35 6 6 5 4 4 5 4 3 5 945

36 7 6 5 3 5 6 2 3 2 1068

37 6 7 6 1 6 3 1 1 1 1145

38 6 8 6 1 5 2 2 1 2 1180

39 6 8 5 3 4 6 3 4 4 1270

40 6 8 5 3 4 6 4 3 5 1282

Neste caso deve-se observar os Seguintes pontos:

a) O tamanho máximo permitido para a linha é de 80 colunas.

b) Os nomes devem ser separados por pelo menos um espaço. Se necessário, pode-se usar mais de uma linha para colocar todos os nomes das variáveis.

c) Os valores das variáveis devem ser separados por pelo menos um espaço em branco. Se necessário, pode-se usar mais de uma linha para digitar os valores de dados.

Observações:

a) Todas as observações devem ocupar o mesmo número de linhas, isto é, se para digitar os valores de todas variáveis da primeira observação são necessárias, por exemplo 3 linhas, então as demais observações também deverão ter 3 linhas.

b) O número de valores de uma observação deve, obrigatoriamente, ser igual ao número de nomes de variáveis fornecidos na(s) primeira(s) linha(s).

c) Qualquer informação perdida de determinada variável deve ser codificada usando simplesmente o ponto decimal, conforme a renda do entrevistado na 5ª observação no exemplo anterior.

1.2 - Campos Definidos

Este tipo de construção de arquivos é normalmente usado quando se tem um número elevado de variáveis, entretanto não existe restrição ao seu uso quando se têm poucas variáveis.

Como no arquivo construído na opção "Texto Não-formatado", as variáveis e observações são colocadas nas colunas e linhas, respectivamente, conforme exemplo a seguir.

NIVEL   1  1  2 0 N

F1      1  4  4 0 N

F2      1  6  6 0 N

F3      1  8  8 0 N

F4      1 10 10 0 N

F5      1 12 12 0 N

F6      1 14 14 0 N

F7      1 16 16 0 N

F8      1 18 18 0 N

F9      1 20 20 0 N

F10     1 22 22 0 N

SALARIO 1 23 27 0 N

FIM

01 1 1 1 3 1 1 1 1 3 2 185

02 2 2 1 2 2 2 1 1 1 1 227

03 2 1 1 3 2 2 1 1 3 1 235

04 2 1 1 3 1 3 2 1 3 3 258

05 1 2 2 3 1 2 2 1 3 3 263

06 2 3 2 3 1 1 2 1 3 2 268

07 2 2 2 2 2 4 1 1 2 2 283

08 2 2 2 3 2 3 2 1 5 4 315

09 2 4 3 3 2 1 1 2 3 2 332

10 2 3 2 3 3 4 2 1 3 3 340

11 2 4 2 3 3 3 1 1 3 2 343

12 3 3 3 4 2 2 1 1 4 3 351

13 2 5 3 3 3 3 2 2 3 3 404

14 4 5 3 1 3 2 1 1 1 1 425

15 3 4 2 3 3 4 3 1 3 4 456

16 3 5 5 2 3 3 1 1 3 3 466

17 3 5 2 4 4 3 1 1 5 4 472

18 3 5 2 4 4 3 1 1 5 4 478

19 4 4 3 3 3 5 2 2 4 3 489

20 3 5 3 4 4 3 2 2 4 4 497

21 3 5 4 2 2 3 1 1 3 2 507

22 4 4 3 4 3 4 3 2 4 4 520

23 4 5 4 4 4 4 1 2 4 4 582

24 4 5 4 4 4 4 2 1 4 4 596

25 4 5 4 4 4 4 2 2 4 4 598

26 5 5 4 3 4 4 1 3 2 2 645

27 5 5 5 1 4 4 1 2 2 2 648

28 5 6 4 4 3 3 3 1 3 2 704

29 5 5 4 5 4 4 2 4 3 4 706

30 5 5 5 2 4 4 1 2 3 3 723

31 5 6 5 1 5 2 1 1 1 1 737

32 5 6 5 3 4 6 1 1 2 4 754

33 6 6 5 2 4 5 1 4 3 3 873

34 6 6 5 1 4 3 1 3 1 1 902

35 6 6 5 4 4 5 4 3 3 5 945

36 7 6 5 3 5 6 2 1 3 2 1068

37 6 7 6 1 6 3 1 1 1 1 1145

38 6 8 6 1 5 2 2 2 1 2 1180

39 6 8 5 3 4 6 3 5 4 4 1270

40 6 8 5 3 4 6 4 5 3 5 1282

 

Na construção deste tipo de arquivo devem ser observados os seguintes pontos.

a) O tamanho máximo da linha é de 999 colunas.

b) Os endereços das variáveis são colocados nas primeiras linhas e a palavra "FIM" é usada para separá-los do dados

c) Se os valores das variáveis não couberem em uma única linha, pode-se usar mais linhas; Contudo, deve-se observar que o endereço (posição de início e fim) dos valores de determinada variável deverá ser o mesmo em todas observações.

Exemplo: supondo que se usem 5 linhas para codificar uma observação e que determinada variável X64 esteja codificada na 3ª linha nas colunas de 26 a 30, então este endereço deverá ser o mesmo em todas observações.

d) Todas as observações devem ter o mesmo número de linhas.

1.3 - Texto com Separadores

Arquivo Texto com separadores

Este tipo de arquivo possui as seguintes características:
(a) Uma linha por observação (Aconselhado)
(b) A primeira linha deve conter os nomes das variáveis, separados pelo símbolo selecionado para ser separador.
(c) Os valores deverão ser colocados nas linha seguintes obedecendo a seqüência dasvariáveis, também contendo o separador.
(d) Quando existir algum valor perdido basta digitar um ponto no local do valor.

Exemplo
 

NIVEL ;F1 ;F2 ;F3 ; F4 ; F5 ; F6 ; F7 ; F8 ; F9 ; F10
01 ; 1 ; 1 ; 1 ; 3 ; 1 ; 1 ; 1 ; 1 ; 3 ; 2
02 ; 2 ; 2 ; 1 ; 2 ; 2 ; 2 ; 1 ; 1 ; 1 ; 1
03 ; 2 ; 1 ; 1 ; 3 ; 2 ; 2 ; 1 ; 1 ; 3 ; 1
04 ; 2 ; 1 ; 1 ; 3 ; 1 ; 3 ; 2 ; 1 ; 3 ; 3
05 ; 1 ; 2 ; . ; 3 ; 1 ; 2 ; 2 ; 1 ; 3 ; 3
06 ; 2 ; 3 ; 2 ; 3 ; 1 ; 1 ; 2 ; 1 ; 3 ; 2
07 ; 2 ; 2 ; 2 ; 2 ; 2 ; 4 ; 1 ; 1 ; 2 ; 2
08 ; 2 ; 2 ; 2 ; 3 ; 2 ; 3 ; 2 ; 1 ; 5 ; 4
09 ; 2 ; 4 ; 3 ; 3 ; 2 ; 1 ; 1 ; 2 ; 3 ; 2
10 ; 2 ; 3 ; 2 ; 3 ; 3 ; 4 ; 2 ; 1 ; 3 ; 3
11 ; 2 ; 4 ; 2 ; 3 ; 3 ; 3 ; 1 ; 1 ; 3 ; 2
12 ; 3 ; 3 ; 3 ; 4 ; 2 ; 2 ; 1 ; 1 ; 4 ; 3
13 ; 2 ; 5 ; 3 ; 3 ; 3 ; 3 ; 2 ; 2 ; 3 ; 3
14 ; 4 ; 5 ; 3 ; 1 ; 3 ; 2 ; 1 ; 1 ; 1 ; 1
15 ; 3 ; 4 ; 2 ; 3 ; 3 ; 4 ; 3 ; 1 ; 3 ; 4
16 ; 3 ; 5 ; 5 ; 2 ; 3 ; 3 ; 1 ; 1 ; 3 ; 3
17 ; 3 ; 5 ; 2 ; 4 ; 4 ; 3 ; 1 ; 1 ; 5 ; 4
18 ; 3 ; 5 ; 2 ; 4 ; 4 ; 3 ; 1 ; 1 ; 5 ; 4
19 ; 4 ; 4 ; 3 ; 3 ; 3 ; 5 ; 2 ; 2 ; 4 ; 3
20 ; 3 ; 5 ; 3 ; 4 ; 4 ; 3 ; 2 ; 2 ; 4 ; 4
21 ; 3 ; 5 ; 4 ; 2 ; 2 ; 3 ; 1 ; 1 ; 3 ; 2
22 ; 4 ; 4 ; 3 ; 4 ; 3 ; 4 ; 3 ; 2 ; 4 ; 4


Neste exemplo tem-se as variáveis NIVEL, F1,F2,...F10. Cada linha corresponde a uma observação. Na linha 5 observa-se que houve a perda valor da variável F3 .
 

Arquivos Gerados pelo LOTUS

SAEG reconhece arquivos no padrão de armazenamento LOTUS, desde que sejam construídos da seguinte forma:

A

B

C

D

E

.

QUES

SEXO

LOCAL

RENDA

   

01

1

1

96.42

   

02

1

2

108.32

   

03

2

1

243.62

   

04

1

3

143.25

   

05

1

2

     

06

2

3

148.72

   

07

1

2

328.25

   

.

.

.

.

   

.

.

.

.

   

Na construção deste arquivo deve-se observar os seguintes pontos:

a) Na primeira linha devem ser colocados os nomes das variáveis, em letras maiúsculas e ajustados a esquerda.

b) Campos gerados por fórmulas não são reconhecidos pelo SAEG.

  1. Os campos cujos valores são perdidos devem ser deixados em branco.

Arquivos gerados pelo EXCEL

 

NIVEL

F1

F2

F3

F4

F5

F6

RENDA

1

1

1

1

3

1

1

185

2

2

2

1

2

2

2

227

3

2

1

1

3

2

2

235

4

2

1

1

3

1

3

258

5

1

2

2

3

1

2

263

6

2

3

2

3

1

1

268

7

2

2

2

2

2

4

283

8

2

2

2

3

2

3

315

9

2

4

3

3

2

1

332

10

2

3

2

3

3

4

340

11

2

4

2

3

3

3

343

12

3

3

3

4

2

2

351

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

 

Arquivos Gerados pelo DBASE

O SAEG somente lê as variáveis que foram declaradas como numéricas. As variáveis do tipo Alfanuméricas são automaticamente excluídas do processo de leitura.

Arquivos Auxiliares

Os arquivos descritos anteriormente são opções de fornecimento de dados brutos ao SAEG. Outros arquivos podem ser criados opcionalmente pelo usuário do sistema, no auxílio a leitura e na manipulação das variáveis.

Arquivos de Endereços (DEF)

Este arquivo cuja finalidade é a descrição dos endereços das variáveis quando o arquivo de dados brutos possui grande número de variáveis ou quando os valores das variáveis não estão separados por espaços, pode ser criado por qualquer editor de texto.

 

 (1) (2) (3) (4) (5)

QUEST 1 1 2 0

SEXO 1 3 3 0

LOCAL 1 4 4 0

RENDA 1 5 9 2

.

.

.

Pode-se observar que este arquivo é constituído de 5 campos, separados por pelo menos um espaço em branco. O primeiro campo (1) identifica o nome da variável; o segundo (2), a linha onde a variável foi codificada (se o arquivo tem uma linha por observação, este campo deverá ser idêntico para todas as variáveis); o terceiro (3) refere-se à coluna de início dos valores; o quarto (4), à coluna de fim de valores e o quinto campo (5), ao número de decimais das variáveis (se as variáveis forem codificadas com o ponto decimal o número de decimais fornecido neste arquivo será ignorado).

NIVEL 1 1 2 0

ESCOLA 1 4 4 0

EXPER 1 6 6 0

ESFMEN 1 8 8 0

ESFFIS 1 10 10 0

RESP1 1 12 12 0

RESP2 1 14 14 0

RESP3 1 16 16 0

AMBIENTE 1 18 18 0

RISCOS 1 20 20 0

SALARIO 1 21 25 0

 

Arquivo de Descrição (DES)

Em muitos casos, o uso de apenas 8 dígitos para nomear uma variável pode não ser suficiente para identificação por parte de outras pessoas que irão analisar os resultados produzidos pelo SAEG. Nesta situação, pode-se associar ao nome de cada variável mais 65 caracteres para sua melhor identificação.

Outra situação é quando determinada variável possui valores de dados que são códigos. Neste caso pode-se associar a cada um destes códigos 20 caracteres para sua identificação. O SAEG permite identificar até 50 códigos por variável.

123456789012345678901234567890123..............................

VARIAVEIS

SEXO SEXO DO ENTREVISTADO

RENDA RENDA MENSAL

VALORES

SEXO (1)MASCULINO (2)FEMININO

.

.

.

FIM

Este arquivo é dividido em dois segmentos: um começando pela palavra VARIAVEIS, a partir da qual, nas linhas seguintes se coloca, nas posições de 1 até 8 (começando na 1), o nome da variável a ser descrita e a partir da coluna 10, a descrição.

O segundo segmento começa com a palavra VALORES e nas linhas seguintes, começando na coluna 1, o nome da variável, cujos valores serão descritos, a partir da coluna 10 os valores, entre parênteses, seguidos de 20 caracteres para descrevê-los.

Se for necessário mais de uma linha para descrever os códigos e uma variável, nas linhas seguintes, deixar as colunas de 1 a 10 em branco..

 

VARIÁVEIS  
NIVEL Nível Salarial
ESCOLA Nível de escolaridade
EXPER Experiencia no trabalho
ESFMEN Esforço mental exigido
ESFFIS Esforço físico exigido
RESP1 Responsabilidade em relação ao pessoal
RESP2 Responsabilidade em relação ao trabalho
RESP3 Responsabilidade em relação ao patrimônio
AMBIENTE Ambiente de trabalho
RISCOS Riscos do cargo
SALARIO Salario recebido no último mes
VALORES  
EXPER (1)Sem Experiencia (2) Até 1 ano (3)Até 4 anos (4)Até 6 anos(5)Até 10 anos(6)Até 15 anos (7)Mais de 15 anos
ESCOLA (1)Sem Instrução (2)Até 1 anos (3)Até 4 anos (4)Até 6 anos (5)Até 10 anos (6)Até 15 anos (7)Mais de 15 anos
FIM  

Observação: Este arquivo deve conter na sua última linha a palavra FIM digitada a partir da coluna 1

Arquivo de Comandos (CMD)

A partir de variáveis contidas no arquivo de dados brutos, pode-se, no SAEG, criar novas variáveis, recodificar valores, relacionar observações etc, por meio de comandos apropriados. Quando o número de comandos for grande ou as expressões aritméticas forem complexas, é desejável que os comandos sejam colocados em arquivo e não sejam fornecidos diretamente durante o processamento.

 

CALCULAR RENDAS = RENDAS * 1.62

SE LOCAL = ENTAO LOCAL = 2

RECODIFICAR RENDA (1 ATÉ 200=1) (200 ATÉ 400=2)

EXECUTAR

Os comandos devem ser digitados nas colunas de 1 até 15 (começando sempre na coluna 1) e os parâmetros do comando, a partir da coluna 16. Se necessário pode-se usar mais de uma linha por comando bastando, nas linhas seguintes, deixar as colunas de 1 a 15 em branco.

Arquivos Gerados pelo SAEG

Durante o processamento de um arquivo de dados brutos qualquer, o SAEG gera vários arquivos de trabalho que poderão ser guardados ou eliminados ao final da execução. Portanto, aconselha-se antes de iniciar a execução verificar a disponibilidade de área no seu dispositivo de armazenamento, principalmente quando seu arquivo de dados brutos for muito grande.

Arquivo de Análises (Wst)

Este arquivo é construído na forma binária, portanto, não-acessível pelo usuário. Nele são armazenadas as seguintes informações: Nome das variáveis lidas e calculadas, título do trabalho e dados propriamente ditos.

Arquivo de Descrição (Lab)

Contém a descrição dos nomes das variáveis e de seus valores. Este arquivo só é gerado quando se usa o procedimento DESCRIÇÃO.

Arquivo de Resultados (Lst)

Este arquivo contém os resultados do último procedimento estatístico executado. Após a execução de qualquer procedimento, o usuário poderá visualizar os resultados, imprimi-los, eliminá-los ou gravá-los no arquivo de Resultados Permanente.

Arquivo de Resultados Salvos (Doc)

Contém o resultado dos procedimentos estatísticos que foram gravados segundo solicitação do usuário. Este arquivo pode ser acessado por qualquer editor de textos.

Arquivos de Gráficos (Bmp)

Contém gráficos, histogramas e dispersões gerados com extensão BMP, que podem ser acessados por produtos como: Excel, Word, Powerpoint, Paintbrush etc.

Outros Arquivos

O SAEG ainda grava outros arquivos temporários, os quais são usados na troca de informações entre procedimentos estatísticos, extensão de memória etc.

Arquivos Internos

SAEG possui um conjunto de arquivos necessários ao seu funcionamento. Estes arquivos, chamados arquivos internos, são fornecidos em disquetes ou CD, junto aos módulos executáveis, e poderão ser alterados pelo usuário quando ocorrer algum problema na instalação ou durante seu uso.

1 - SAEG.INI

Este arquivo (SAEG.INI) contém as informações referentes à associação do SAEG com outros produtos ("softwares") instalados em seu computador, definição de cores, parâmetros de impressão, outros módulos executáveis não-convencionais e relação dos sete últimos arquivos processados pelo SAEG.

Ferramentas

As ferramentas a serem instaladas obrigatoriamente no SAEG são: editor notepad ou wordpad ou outro qualquer, editor de textos (Winword.exe), planilha eletrônica (Excel.exe) e editor de gráficos (Pbrush.exe). Em conseqüência da compatibilidade entre "softwares", recomenda-se usar somente as versões 7.0 do Word e do Excel.

Além dessas ferramentas é necessário informar o endereço e o nome do papel de parede (arquivo BMP) que serão usados na tela de apresentação. Caso o nome fornecido não exista, o sistema mostrará a tela padrão da versão 7.0. Em último lugar na lista de ferramentas deverá ser informado o subdiretório onde se encontram os arquivos de proteção contra cópias.

2 - SAEG.003

Neste arquivo estão armazenadas as mensagens de erros do SAEG. Estas mensagens são referentes aos erros de sintaxe, para todos os procedimentos, para manipulação de arquivos e análises estatísticas.

3 - SAEG.001

Este arquivo contém códigos referentes às possibilidades de processamento monousuário ou processamento em rede. Portanto, o mesmo não deverá ser alterado pelo usuário. Caso este arquivo tenha sido destruído ou alterado, a recuperação deverá ser executada pela reinstalação do disquete de número 1.

4 - SAEG.002

Arquivo retentor de códigos para configuração da tela inicial do SAEG. Este arquivo não poderá ser alterado ou eliminado. Sua recuperação deverá ser executada conforme procedimento descrito para o arquivo SAEG.002.

5 - SAEGXX.HLP

Arquivos que contêm as explicações referentes a descrição geral, opções de processamento, sintaxe e outras dicas importantes para cada um dos XX procedimentos do SAEG.

6 - SAEG.EXE

Módulos executáveis do SAEG. Cada módulo corresponde a um procedimento para manipulação de arquivos ou para análises estatísticas.