- 编程语言81
- 案例70
- 大数据55
- 中间件48
- 电子书42
- 数据库42
- Go30
- 开源27
- 人工智能25
- CI&CD24
- 软件工程23
- 设计模式23
- Python21
- 数据仓库21
- 任正非20
- Docker20
- 杂项20
- JMeter17
- 微服务15
- 移动端15
- HarmonyOS15
- MySQL15
- Flink14
- 节略章节合辑13
- 软件许可证13
- 原型解构13
- 数据库设计13
- 新零售13
- 分库分表13
- 应用12
- 社交平台12
- 关系推荐12
- 数据科学基础12
- 关于11
- 胡言乱语11
- Linux11
- Clickhouse11
- 集成10
- 原型工具10
- 开发过程10
- Java10
- Spark10
- RocketMQ10
- Axure9
- U-AIGC9
- UI原型9
- Scala8
- Groovy8
- 兼容GPL的许可证8
- 产品经理8
- 智能硬件8
- 大数据风控8
- 爬虫8
- MongoDB8
- Kotlin8
- LUA8
- 程序员的数学7
- 短视频7
- APP7
- Hive7
- 七大设计原则7
- ArkTS7
- GPT6
- API6
- Hadoop6
- HBase6
- 领域模型6
- Kafka6
- Spring Security6
- Java高并发6
- 关于我5
- 开源常识5
- 车联网5
- Redis5
- Aviator5
- Flume5
- Caffeine5
- Google Guava5
- 毛泽东选集4
- 工具4
- 特色农产品4
- 文档许可证4
- 自由文档许可证4
- 其他许可证4
- 可穿戴产品4
- 流水线4
- Elasticsearch4
- Neo4j4
- 技术论文3
- 我写的书3
- 跑腿闪送3
- 设计心理学3
- 分布式3
- Android3
- 不兼容GPL的许可证3
- 电商3
- PC端3
- Apache Commons3
- Drools2
- 非自由软件许可证2
- 用户研究2
- 个人爱好1
- 个人能力1
- 超级个体1
- 第一卷1
- AIGC1
- 视觉交互设计1
- 数学1
- 站点部署1
- 智能穿戴1
- Balsamiq Mockups1
- Apache1
- AB压测1
- 第二卷1
- 第三卷1
- 第四卷1
- captcha1
- FaceRecognition1
- 地图1
- OSS1
- 支付1
- PUSH1
- OAuth 2.01
- SMS1
- weather1
- 综合性交互设计1
- 复杂设计1
- 情感设计1
- 云原生1
- 全局唯一ID1
- 幂等性1
- 事务1
- 瀑布模型1
- Azkaban1
- Canal1
- FileBeat1
- Sqoop1
- Zepplin1
- Lua1
- 加密算法1
- SSL1
- TLS1
- CA证书1
- HTTPS1
- Spring AI1
- 用户体验五要素1
- UFD分析法1
- 产品类型1
- 盈利模式1
- 可行性判断1
- 定价策略1
- 黑盒测试1
- 灰度测试1
- AB测试1
- PEST1
- SWOT1
- MRD1
- PRD1
- KANO模型分析1
- 需求价值分析1
- 车机交互1
- 分布式事务1
- Matplotlib1
- Pandas1
- Numpy1
- Scipy1
- Impala1
- 合成复用原则1
- 迪米特法则1
- 依赖反转原则1
- 接口隔离原则1
- 里氏替换原则1
- 开闭原则1
- 单一职责原则1
- 敏捷过程1
- RUP1
- UML1
- ERD1
- ElasticSearch1
- Cangjie1
- Cache1
- EventBus1
- common-fileupload1
- commons-lang31
原创大约 22 分钟
虽然前面已经介绍了大量的聚合函数,但还是有一些高频出现的没覆盖到,所以这里就来集中汇总一下。
1. topK(N)(x)
经常会出现统计数量,然后按数量的倒序排序并取前N个值的场景,这就是典型的TopN
需求。
Clickhouse直接提供了返回指定列中最频繁出现的前N个值的函数。
原创大约 6 分钟
Clickhouse一共指定了二十多个函数为高阶函数,它们中的大部分都在高阶函数中列出。
由于文档更新原因,有些函数没列出来,而有些函数的文档有错误,这里全部都一一修正。
原创大约 14 分钟
原创大约 16 分钟
Clickhouse的语法并不复杂,但是有些查询语句不仅比较难理解,而且出现的频率还极高。
能够用好它们,做大数据的OLAP基本上没啥难度。用不好,面对一大堆数据可能会觉得无从下手。
这里就来盘点盘点。
WITH子句
原创大约 37 分钟
作为一个专门用于OLAP
数据分析,且目前最快的数据库系统,Clickhouse之前是不支持更新和删除操作的,但迫于需求压力,还是增加了这两种功能。
为了兼顾存储效率和查询性能,Clickhouse为不同的应用场景提供了不同的删除方式。
原创大约 6 分钟
想知道Clickhouse都有哪些数据类型和哪些设置,可以通过如下SQL语句查询。
:) SELECT * FROM system.data_type_families
:) SELECT * from system.settings
原创大约 12 分钟
数据库引擎
1. MySQL引擎
用于将远程MySQL服务器中的表映射到Clickhouse,并对这些表进行INSERT
和SELECT
操作。其实它就是一个Clickhouse操作MySQL数据库的接口。
原创大约 20 分钟
概念
分区
分区是针对表而言的,Clickhouse可以把一张表拆分成多个区块,这类似于MySQL
的水平分表。
分区后的表还是一张表,数据处理还是由自己来完成。
建表时加入partition
关键字,允许查询在指定分区键的条件下,尽可能的少读取数据,提升性能。
原创大约 5 分钟