首页 > 热点播报 > 正文

火山引擎ByteHouse:如何用OLAP为抖音精准推荐提效

抖音依靠自身推荐系统为用户推送可能感兴趣的视频内容,其中离不开对兴趣用户的精准圈选。对兴趣用户的圈选主要通过理解核心用户的偏好特征,判断两者偏好的相似性,从而构建同类用户的兴趣圈层,实现精准推荐。

以往的兴趣圈层往往依赖单一的维度或标签,比如内容类型、时长、地理特征等,难以揭示用户兴趣的底层逻辑。例如,“重庆美女小姐姐吃播视频”“二次元古风舞蹈视频”,从表面上看,吃播与舞蹈、重庆与古风.....标签类型完全不相同。经过深度分析,运营人员发现喜欢两个视频竟然是同类人群。通过挖掘用户底层兴趣逻辑,将共同兴趣的人划分在同一个兴趣圈层中,并向他们推荐更多相关内容,是抖音兴趣圈层平台主要的能力之一。

要搭建这样一套兴趣圈层平台,不仅需要精细的算法策略,对底层数据存储架构也是一大挑战。之前,技术团队主要采用MySQL作为存储架构。作为一种行式存储的数据库,MySQL对于大量数据的处理效率不尽如人意,需要高配置硬件,甚至要采用分片、读写分离等策略来提升性能,导致硬件成本显著提高。其中,MySQL的瓶颈还体现在:

· 每日新增数据量庞大:抖音用户圈层基础信息表日增万级数据,圈层作者信息表日增百万数据,圈层用户信息表日增千万条左右数据,已经达到 MySQL 秒级千万级查询的性能瓶颈。

网友评论

热门IT产品
  1. ¥7599
    苹果iPhoneX 64GB
    ·
  2. ¥5799
    三星S9
    ·
  3. ¥4498
    vivo NEX旗舰版
    ·
  4. ¥4999
    OPPO Find X
    ·
  5. ¥1799
    努比亚Z18mini
    ·
  6. ¥1499
    OPPO A5
    ·
  7. ¥1999
    荣耀Play(4GB RAM)
    ·
  8. ¥1598
    vivo Y85
    ·
  9. ¥3499
    坚果R1(6GB RAM)
    ·
  10. ¥3599
    一加6(8GB RAM)
    ·