update RTDmpRequest filter by define update_date

2dc96cc2 · WangJinfeng · b7a056cd · 2dc96cc2 · 2dc96cc2 · 2dc96cc2
Commit 2dc96cc2 authored Aug 04, 2021 by WangJinfeng
3 changed files
--- a/src/main/resources/config.properties
+++ b/src/main/resources/config.properties
@@ -129,4 +129,6 @@ tencent.package_name=com.tencent.news_bes,com.tencent.news_bes_7,com.tencent.new
 youku_acquisition.package_name=com.youku.foracquisition_imei,com.youku.foracquisition_oaid
 rtdmp.stop.audience=433,406,405,407,390,395,389,123,238,388,1133,1134,1135
\ No newline at end of file
+define.package_name.update_date=com.sankuai.meituan_oppo:0,com.sankuai.meituan_bes:0,com.sankuai.meituan_iqiyi:0
\ No newline at end of file
--- a/src/main/scala/mobvista/dmp/datasource/rtdmp/Constant.scala
+++ b/src/main/scala/mobvista/dmp/datasource/rtdmp/Constant.scala
@@ -85,8 +85,8 @@ object Constant {
  //  AND check_package(package_name)
  val device_sql =
    """
-      |SELECT device_id, device_type, platform, package_name
+      |SELECT device_id, device_type, platform, package_name, update_date
-      |   FROM dwh.@table WHERE dt = '@dt' AND business = '@business' @check_update_date @check_package @check_hr
+      |   FROM dwh.@table WHERE dt = '@dt' AND business = '@business' @check_package @check_hr
      |   GROUP BY device_id, device_type, platform, package_name
      |""".stripMargin

--- a/src/main/scala/mobvista/dmp/datasource/rtdmp/RTDmpRequest.scala
+++ b/src/main/scala/mobvista/dmp/datasource/rtdmp/RTDmpRequest.scala
@@ -99,10 +99,8 @@ class RTDmpRequest extends CommonSparkJob with Serializable {
      if (!hh.equals("00")) {
        device_sql = device_sql.replace("@check_hr", s"AND hh = '$hh'")
-          .replace("@check_update_date", "")
      } else {
        device_sql = device_sql.replace("@check_hr", "")
-          .replace("@check_update_date", s"AND update_date = '$update_date'")
      }
      println(s"package_name_set.size -->> ${package_name_set.size}")
@@ -116,7 +114,22 @@ class RTDmpRequest extends CommonSparkJob with Serializable {
          Integer.valueOf(r)
        })
-      val rdd = spark.sql(device_sql).rdd.map(r => {
+      val filterMap: mutable.Map[String, Int] = new mutable.HashMap[String, Int]()
+      PropertyUtil.getProperty("config.properties", "define.package_name.update_date").split(",", -1)
+        .foreach(str => {
+          val kv = str.split(":", -1)
+          filterMap.put(kv(0), Integer.valueOf(kv(1)))
+        })
+      val rdd = spark.sql(device_sql).rdd
+        .filter(r => {
+          val package_name = r.getAs[String]("package_name")
+          val update_date = r.getAs[String]("update_date")
+          val days: Int = filterMap.getOrElse(package_name, 0)
+          val filterDate = DateUtil.getDay(DateUtil.parse(date, "yyyyMMdd"), "yyyy-MM-dd", -days)
+          update_date.compareTo(filterDate) >= 0
+        }).map(r => {
        val device_id = r.getAs[String]("device_id")
        var device_type = r.getAs[String]("device_type")
        val platform = r.getAs[String]("platform")