240 发简信
IP属地:北京
  • 2024-03-19让 LLM 稳定输出 JSON

    LLMs 是如何工作的 非常高层级的 GPT 模型,包括 ChatGPT、GPT-4、GPT-3.5-turbo,它们接受过庞大的数据集的训练,...

  • Resize,w 360,h 240
    大数据 ETL 处理工具 Kettle 常用输入输出

    相比现在流行大数据技术,你可能觉得 Kettle 的使用场景太少了,或者没有必要使用这么个玩意儿,查看了下 github kettle[http...

  • Resize,w 360,h 240
    Excel数据模型自动生成Hive建表语句

    最近在「空白女侠」公号上看到她回答了大家会困扰的精力问题,比如为什么我(空白女侠)能同时做那么多事情,精力那么充沛?工作中遵循一个真理: 复杂的...

  • Resize,w 360,h 240
    大数据 ETL 处理工具 Kettle 的核心概念

    宏观了解 Kettle 上一篇中对 Kettle 进行了简单的介绍,并快速体验了一把 Kettle,完成了「把数据从 CSV 文件复制到 Exc...

  • Resize,w 360,h 240
    大数据 ETL 处理工具 Kettle 入门实践

    Kettle 简介 ETL(Extract-Transform-Load 的缩写,即数据抽取、转换、装载的过程),对于数据开发人员来说,我们经常...

  • Resize,w 360,h 240
    数据仓库开发规范

    00背景 规范约束是数仓建设的全流程,以及后续的迭代和运维的参照。事实上,数仓规范文档,应该随着架构设计文档,在数仓开发启动之前,分发给所有相关...

    1.3 1819 0 17
  • Elastic Stack 系列专辑

    Elastic Stack 是 ELK Stack 的更新换代产品,那么,ELK 到底是什么呢?“ELK”是三个开源项目的首字母缩写,这三个项目...

  • Resize,w 360,h 240
    1分钟系列-Kibana 简介与数据探索

    在 Elasticsearch 查看数据 在数据浏览查看索引数据,如下图: 下面分享在 Kibana 中查看数据,一张图片胜过千万行日志 Kib...

  • Resize,w 360,h 240
    Spark性能优化指南——基础篇

    前言 在大数据计算领域,Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark的功能涵盖了大数据领域的离线批处理、SQL类处理、...