小红书推荐系统公开课学习笔记05-重排

重排是精排的后处理操作。

物品多样性

相似度度量

  • 基于物品属性标签
  • 基于物品向量表征

(1)双塔模型的物品塔,但是因为头部效应问题导致学不好物品向量表征

(2)基于图文内容学习

CLIP – 基于图文内容的物品向量表征

原理

对于图片-文本二元组数据进行对比学习,预测图文是否匹配。优点是:无需人工标注。参考文献《Learning Transferable Visual Models From Natural Language Supervision》和解读文章《对Connecting Text and Images的理解》。

正样本

同一个物品中的图片和文字二元组数据构成正样本。

负样本

同batch内,正样本的图片与其他样本的文字组成的二元组数据构成负样本。

image-20230416004943510

MMR多样性算法

原理

MMR算法中需要计算两个物品的相似度,这个相似度计算就用上一小节提到的CLIP方法学习到的物品Embedding向量的余弦相似度计算即可。

image-20230416005624631

步骤

image-20230416005759680

滑动窗口解决S集合过大问题

核心思想就是只考虑待排列表中最后一个窗口范围内的物品无相似(多样性好)即可。

image-20230416005938631

业务规则控制多样性

通常是MMR+规则控制多样性

DPP

数学原理

image-20230416010339177

image-20230416010408983

计算思路

image-20230416010542425

求解方法

暴力方法

image-20230416011056075

Hulu方法

image-20230416011146962

DPP+滑动窗口

image-20230416011239145

参考文献

公开课地址:GitHub

本文永久更新地址: https://notlate.cn/p/eb73eb0901934624/

评论

  1. free
    匿名
    Edge
    1 年前
    2023-7-04 10:06:58

    ?不是不是,一名苦瓜而已。

  2. 匿名
    Chrome
    2 年前
    2023-6-08 17:42:59

    王晓博的徒弟?

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇