Перейти к основному содержанию
Перейти к основному содержанию

chDB для Go

chDB-go предоставляет привязки Go для chDB, позволяя запускать запросы ClickHouse напрямую в ваших Go-приложениях без внешних зависимостей.

Установка

Шаг 1: Установка libchdb

Сначала установите библиотеку chDB:

curl -sL https://lib.chdb.io | bash

Шаг 2: Установка chdb-go

Установите пакет Go:

go install github.com/chdb-io/chdb-go@latest

Или добавьте его в ваш go.mod:

go get github.com/chdb-io/chdb-go

Использование

Интерфейс командной строки

chDB-go включает CLI для быстрых запросов:

# Простой запрос
./chdb-go "SELECT 123"

# Интерактивный режим
./chdb-go

# Интерактивный режим с постоянным хранилищем
./chdb-go --path /tmp/chdb

Библиотека Go - быстрый старт

Запросы без состояния

Для простых одноразовых запросов:

package main

import (
    "fmt"
    "github.com/chdb-io/chdb-go"
)

func main() {
    // Выполнение простого запроса
    result, err := chdb.Query("SELECT version()", "CSV")
    if err != nil {
        panic(err)
    }
    fmt.Println(result)
}

Запросы с состоянием через сессию

Для сложных запросов с постоянным состоянием:

package main

import (
    "fmt"
    "github.com/chdb-io/chdb-go"
)

func main() {
    // Создание сессии с постоянным хранилищем
    session, err := chdb.NewSession("/tmp/chdb-data")
    if err != nil {
        panic(err)
    }
    defer session.Cleanup()

    // Создание базы данных и таблицы
    _, err = session.Query(`
        CREATE DATABASE IF NOT EXISTS testdb;
        CREATE TABLE IF NOT EXISTS testdb.test_table (
            id UInt32,
            name String
        ) ENGINE = MergeTree() ORDER BY id
    `, "")

    if err != nil {
        panic(err)
    }

    // Вставка данных
    _, err = session.Query(`
        INSERT INTO testdb.test_table VALUES
        (1, 'Alice'), (2, 'Bob'), (3, 'Charlie')
    `, "")

    if err != nil {
        panic(err)
    }

    // Запрос данных
    result, err := session.Query("SELECT * FROM testdb.test_table ORDER BY id", "Pretty")
    if err != nil {
        panic(err)
    }

    fmt.Println(result)
}

Интерфейс SQL-драйвера

chDB-go реализует интерфейс Go database/sql:

package main

import (
    "database/sql"
    "fmt"
    _ "github.com/chdb-io/chdb-go/driver"
)

func main() {
    // Открытие подключения к базе данных
    db, err := sql.Open("chdb", "")
    if err != nil {
        panic(err)
    }
    defer db.Close()

    // Запрос с использованием стандартного интерфейса database/sql
    rows, err := db.Query("SELECT COUNT(*) FROM url('https://datasets.clickhouse.com/hits/hits.parquet')")
    if err != nil {
        panic(err)
    }
    defer rows.Close()

    for rows.Next() {
        var count int
        err := rows.Scan(&count)
        if err != nil {
            panic(err)
        }
        fmt.Printf("Count: %d\n", count)
    }
}

Потоковые запросы для больших наборов данных

Для обработки больших наборов данных, которые не помещаются в памяти, используйте потоковые запросы:

package main

import (
    "fmt"
    "log"
    "github.com/chdb-io/chdb-go/chdb"
)

func main() {
    // Создание сессии для потоковых запросов
    session, err := chdb.NewSession("/tmp/chdb-stream")
    if err != nil {
        log.Fatal(err)
    }
    defer session.Cleanup()

    // Выполнение потокового запроса для большого набора данных
    streamResult, err := session.QueryStreaming(
        "SELECT number, number * 2 as double FROM system.numbers LIMIT 1000000",
        "CSV",
    )
    if err != nil {
        log.Fatal(err)
    }
    defer streamResult.Free()

    rowCount := 0

    // Обработка данных по фрагментам
    for {
        chunk := streamResult.GetNext()
        if chunk == nil {
            // Больше нет данных
            break
        }

        // Проверка ошибок потока
        if err := streamResult.Error(); err != nil {
            log.Printf("Streaming error: %v", err)
            break
        }

        rowsRead := chunk.RowsRead()
        // Здесь можно обработать данные фрагмента
        // Например, записать в файл, отправить по сети и т.д.
        fmt.Printf("Processed chunk with %d rows\n", rowsRead)
        rowCount += int(rowsRead)
        if rowCount%100000 == 0 {
            fmt.Printf("Processed %d rows so far...\n", rowCount)
        }
    }

    fmt.Printf("Total rows processed: %d\n", rowCount)
}

Преимущества потоковых запросов:

  • Эффективность памяти - Обработка больших наборов данных без загрузки всего в память
  • Обработка в реальном времени - Начало обработки данных сразу после поступления первого фрагмента
  • Поддержка отмены - Возможность отменить длительные запросы с помощью Cancel()
  • Обработка ошибок - Проверка ошибок во время потоковой передачи с помощью Error()

Документация API

chDB-go предоставляет API как высокого, так и низкого уровня:

Системные требования

  • Go 1.21 или новее
  • Совместим с Linux, macOS