> ## Documentation Index
> Fetch the complete documentation index at: https://private-7c7dfe99-home-button.mintlify.site/llms.txt
> Use this file to discover all available pages before exploring further.

> Permite processar arquivos do HDFS em paralelo a partir de vários nós em um cluster especificado.

# hdfsCluster

Permite processar arquivos do HDFS em paralelo a partir de vários nós em um cluster especificado. No iniciador, cria uma conexão com todos os nós do cluster, expande os asteriscos no caminho do arquivo HDFS e distribui cada arquivo dinamicamente. No nó worker, consulta o iniciador sobre a próxima tarefa a ser processada e a executa. Isso se repete até que todas as tarefas sejam concluídas.

<div id="syntax">
  ## Sintaxe
</div>

```sql theme={null}
hdfsCluster(cluster_name, URI, format, structure)
```

<div id="arguments">
  ## Argumentos
</div>

| Argumento      | Descrição                                                                                                                                                                                                                                                                                                                                                   |
| -------------- | ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
| `cluster_name` | Nome de um cluster usado para montar um conjunto de endereços e parâmetros de conexão para servidores remotos e locais.                                                                                                                                                                                                                                     |
| `URI`          | URI de um arquivo ou de um conjunto de arquivos. Suporta os seguintes caracteres curinga no modo somente leitura: `*`, `**`, `?`, `{'abc','def'}` e `{N..M}`, em que `N`, `M` — números; `abc`, `def` — strings. Para mais informações, consulte [Caracteres curinga no caminho](/pt-BR/reference/engines/table-engines/integrations/s3#wildcards-in-path). |
| `format`       | O [formato](/pt-BR/reference/formats) do arquivo.                                                                                                                                                                                                                                                                                                           |
| `structure`    | Estrutura da tabela. Formato: `'column1_name column1_type, column2_name column2_type, ...'`.                                                                                                                                                                                                                                                                |

<div id="returned_value">
  ## Valor retornado
</div>

Uma tabela com a estrutura especificada para ler dados do arquivo especificado.

<div id="examples">
  ## Exemplos
</div>

1. Suponha que temos um cluster do ClickHouse chamado `cluster_simple` e vários arquivos com os seguintes URIs no HDFS:

* 'hdfs\://hdfs1:9000/some\_dir/some\_file\_1'
* 'hdfs\://hdfs1:9000/some\_dir/some\_file\_2'
* 'hdfs\://hdfs1:9000/some\_dir/some\_file\_3'
* 'hdfs\://hdfs1:9000/another\_dir/some\_file\_1'
* 'hdfs\://hdfs1:9000/another\_dir/some\_file\_2'
* 'hdfs\://hdfs1:9000/another\_dir/some\_file\_3'

2. Consulte o número de linhas nesses arquivos:

```sql theme={null}
SELECT count(*)
FROM hdfsCluster('cluster_simple', 'hdfs://hdfs1:9000/{some,another}_dir/some_file_{1..3}', 'TSV', 'name String, value UInt32')
```

3. Consulte a quantidade de linhas em todos os arquivos desses dois diretórios:

```sql theme={null}
SELECT count(*)
FROM hdfsCluster('cluster_simple', 'hdfs://hdfs1:9000/{some,another}_dir/*', 'TSV', 'name String, value UInt32')
```

<Note>
  Se a sua lista de arquivos contiver intervalos numéricos com zeros à esquerda, use a sintaxe com chaves para cada dígito separadamente ou use `?`.
</Note>

<div id="related">
  ## Relacionados
</div>

* [motor HDFS](/pt-BR/reference/engines/table-engines/integrations/hdfs)
* [função de tabela HDFS](/pt-BR/reference/functions/table-functions/hdfs)
