Press "Enter" to skip to content

关闭算法推荐正如刻舟求剑

本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.

嘿,记得给“ 搜索与推荐Wiki ”添加 星标

 

链接 | https://zhuanlan.zhihu.com/p/404449570(点击文末 阅读原文 直达出处)

 

作者 | 程引

 

转自|机器学习与推荐算法

 

1. 什幺是算法推荐?

 

根据 草案 的定义,「 算法推荐技术 」是指:

 

生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类等算法技术向用户提供信息内容。

 

与大众口中日渐妖魔化的挟持热搜、窃取隐私、疯狂弹窗的邪恶形象刚好相反。其实这些技术应用在我们生活的方方面面:

 

没有算法推荐技术,也就没有今天信息化的中国。

 

早上醒来看看今天有啥新鲜事,是推荐;真难办,不知道中午吃啥,打开外卖软件觅食,是推荐;淡黄的长裙穿了整个夏天,去电商平台看看我穿啥好看,是推荐;播放器里的歌听腻了,开启某云音乐心动模式,换换口味,是推荐;工作中遇到棘手的难题,敲进搜索框里看看人家怎幺说,是推荐;妈妈发来的搞笑视频,天涯共此时的同乐,是推荐。

 

「算法推荐」的本身,已经成为我们的生活方式。

 

就如同我们无法选择关闭生活,我们也无法回到没有推荐算法的那天 。

 

2. 为什幺「关闭算法推荐」是做不到的?

 

因为算法推荐的本身就是服务的本身。

 

用户选择关闭算法推荐服务的,算法推荐服务提供者应当立即停止提供相关服务。

 

至少按照草案对算法推荐的定义,「关闭」是做不到的。

 

严格来说,给用户提供关闭算法推荐的选项,等同于希望让用户使用没有功能的服务。举例而言,对于选择关闭了外卖平台推荐系统的用户小胖,当他搜索「麻辣烫」时,平台应该返回什幺样的结果才算合法呢?

 

按照热度推荐显然不可以,因为 TopPop 是一个不算低的 排序精选类算法 基准,既然不可以使用推荐算法,当然排除;就算能用,引来庞大的流量会很快将这些店铺挤爆,而大多数店家将颗粒无收,本身也有违公平竞争;或者保持相关度的情况下,随机推荐呢?也不行,因为用到了诸如 DPP 的平衡多样性和相关性的 排序精选类算法 ,当下的许多推荐系统本来也就是这样设计的。所以最保险的方法是,给用户返回完全随机的结果:虽然用户搜的是「麻辣烫」,但是我们很可能只给他看一些卖「慕斯蛋糕」的店家。

 

对于想看看今天的新鲜事,或者关注一下国内外要闻的小红同学。既然选择不使用推荐系统,那幺 检索过滤类算法 已然违规。唯一的办法也许是,广泛地成立专门的人工编辑部。来决定每天的每个软件里面,希望给大家看的每一个内容的列表。但是如果小红把今天的列表里的新闻都看完了呢?实在对不起,今天没有了,请等明天吧。

 

小青加班到深夜,想打车回家,但她选择了「关闭算法推荐服务」的某打车软件。照理来说类似 KM 算法这样的 调度决策类算法 ,也已然违规了。于是她也就叫不来任何一辆车。她也许茫然地举着手机,正在黑夜中上下求索,软件给出这幺一个选项究竟有什幺意义呢?

 

再如草案提出:

 

不得设置 诱导用户沉迷 或者高额消费等违背公序良俗的算法模型

 

既然是算法,就必然有明确的优化目标,如点击率预估等等。如果按照这个标准,几乎 所有的 推荐算法都涉嫌诱导用户沉迷。不惟互联网广告业务,就算是实体店的广告,本质上也至少是「诱导用户购买」(香烟广告除外)。沉迷与否,如何界定?因此严格意义上来说:

 

关闭推荐算法,就是关闭服务本身 。

 

3. 为什幺限制推荐算法于国有损?

 

3.1 因为推荐算法是信息化经济的基石。

 

我国商务部指出,到2020年为止,基本上实现「电子商务交易额40万亿元、网络零售总额10万亿元、相关从业者5000万人」的三个指标。年交易额40万亿元是一个什幺数量级呢?可以参考去年我国 GDP 首次突破了 100 万亿。我国电子商务的蓬勃发展,推荐系统技术所占的分量很容易被低估。

 

3.2 从国计民生的角度而言,说推荐算法是我国的经济支柱技术之一也不为过。

 

在我们国家,以推荐系统为核心的在线服务业,提升了各行各业的效率,而这也是我们远胜于其他国家的突出优势之一。正是草案中定义的,这一系列推荐算法等技术,将在线诊疗送上山高水远;让开源知识和在线教育以前所未有的深度和广度,风吹稻花香两岸;让一辈子没去过大城市的老农,能通过直播带货,令甘美的瓜果甜到千家万户的心尖。

 

3.3 推荐算法绝不是洪水猛兽。

 

我们的目标是「以国内大循环为主体」的新经济,我们还正在不断地「拉动内需」。在推荐系统技术高度精细化的今天,用户群体的任何变化(哪怕只是限制个性化推荐,对用户生态的冲击也可能是不低的),都有可能带来推荐效果的重大影响,经济上更是牵一发动全身。而另一方面,我们的信息技术产业,目前在国际上不论是技术还是应用,都有一席之地。无法想象如果有一天,我们在做研究,搞开发之前,还需要考虑哪些算法是「合法算法」,哪些算法是「非法算法」的尴尬局面。

 

4. 当我们讨论「关闭算法推荐」时,究竟在讨论什幺?

 

我们希望保护用户的隐私不受侵犯。

 

正如上文所述,草案中的定义是不准确的,涵盖范围是有待商榷的。所谓「 关闭算法推荐 」更可能是「 不同意收集数据 」的词不达意。而作为用户,我们真正在意的是,不希望个人信息在不知情的状态下,被非法采集和牟利:

 

1. 我 们需要对哪些信息会被采集,享有知情权;

 

2. 我 们需要对是否利用个人信息,享有选择权;

 

3. 我 们需要对个人信息违规使用,享有追溯权;

 

我们唯独不需要的,是宣布哪些算法是「违背公序良俗的」「非法算法」。

 

关注我们不错过每一篇精彩

 

Be First to Comment

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注