wc -l file 查看文件行数 tar -czvf new_data.tar.gz data.txt 压缩文件 tar -xzvf tar....
select concat(act_dep_city,'_',act_arr_city) as key, concat(round(cast...
关于flink中的watermark Watermark 基本概念 我们知道,流处理从事件产生,到流经source,再到operator,中间是...
方法一 :避免shuffle 对于可以避免进行shu的要避免进行shuffle这样就从根本上解决数据倾斜,大致思路就是如果直接将同一个key对应...
String、StringBuffer和StringBuilder类的区别 在Java中字符串属于对象,Java 提供了 String 类来创建...
3、去过xx的人也喜欢yy 计算口径:所有账户(username,过滤大单用户账号)取最近5个订单,求某个账号任意2个航线的共现次数,除以2...
注释:即使两个表join,一个里面的都是唯一的,一个是包含重复的值的话依然会造成笛卡尔积 hive> desc tmp.0703testxhh;...
关于combine的具体信息,见图中的两条黑线的下面,黑线的上面指的是combine可以设置的地点
select count(1) from ( select t1.dt dt,t1.uid uid,t1.search_arr_city dep...