科技: 人物 企业 技术 IT业 TMT
科普: 自然 科学 科幻 宇宙 科学家
通信: 历史 技术 手机 词典 3G馆
索引: 分类 推荐 专题 热点 排行榜
互联网: 广告 营销 政务 游戏 google
新媒体: 社交 博客 学者 人物 传播学
新思想: 网站 新书 新知 新词 思想家
图书馆: 文化 商业 管理 经济 期刊
网络文化: 社会 红人 黑客 治理 亚文化
创业百科: VC 词典 指南 案例 创业史
前沿科技: 清洁 绿色 纳米 生物 环保
知识产权: 盗版 共享 学人 法规 著作
用户名: 密码: 注册 忘记密码?
    创建新词条
科技百科
  • 人气指数: 34155 次
  • 编辑次数: 2 次 历史版本
  • 更新时间: 2013-03-09
高兴
高兴
发短消息
高兴
高兴
发短消息
相关词条
社会动员
社会动员
删帖利益链
删帖利益链
网络舆情分析师
网络舆情分析师
网络谣言司法解释
网络谣言司法解释
房姐事件
房姐事件
微博删帖机制分析
微博删帖机制分析
解码《江南Style》
解码《江南Style》
微博议政特征
微博议政特征
网络谣言分析
网络谣言分析
网络反腐风暴
网络反腐风暴
推荐词条
希拉里二度竞选
希拉里二度竞选
《互联网百科系列》
《互联网百科系列》
《黑客百科》
《黑客百科》
《网络舆情百科》
《网络舆情百科》
《网络治理百科》
《网络治理百科》
《硅谷百科》
《硅谷百科》
2017年特斯拉
2017年特斯拉
MIT黑客全纪录
MIT黑客全纪录
桑达尔·皮查伊
桑达尔·皮查伊
阿里双十一成交额
阿里双十一成交额
最新词条

热门标签

微博侠 数字营销2011年度总结 政务微博元年 2011微博十大事件 美国十大创业孵化器 盘点美国导师型创业孵化器 盘点导师型创业孵化器 TechStars 智能电视大战前夜 竞争型国企 公益型国企 2011央视经济年度人物 Rhianna Pratchett 莱恩娜·普莱契 Zynga与Facebook关系 Zynga盈利危机 2010年手机社交游戏行业分析报告 游戏奖励 主流手机游戏公司运营表现 主流手机游戏公司运营对比数据 创建游戏原型 正反馈现象 易用性设计增强游戏体验 易用性设计 《The Sims Social》社交亮 心理生理学与游戏 Kixeye Storm8 Storm8公司 女性玩家营销策略 休闲游戏的创新性 游戏运营的数据分析 社交游戏分析学常见术语 游戏运营数据解析 iPad风行美国校园 iPad终结传统教科书 游戏平衡性 成长类型及情感元素 鸿蒙国际 云骗钱 2011年政务微博报告 《2011年政务微博报告》 方正产业图谱 方正改制考 通信企业属公益型国企 善用玩家作弊行为 手机游戏传播 每用户平均收入 ARPU值 ARPU 游戏授权三面观 游戏设计所运用的化学原理 iOS应用人性化界面设计原则 硬核游戏 硬核社交游戏 生物测量法研究玩家 全球移动用户 用户研究三部曲 Tagged转型故事 Tagged Instagram火爆的3大原因 全球第四大社交网络Badoo Badoo 2011年最迅猛的20大创业公司 病毒式传播功能支持的游戏设计 病毒式传播功能 美国社交游戏虚拟商品收益 Flipboard改变阅读 盘点10大最难iPhone游戏 移动应用设计7大主流趋势 成功的设计文件十个要点 游戏设计文件 应用内置付费功能 内置付费功能 IAP功能 IAP IAP模式 游戏易用性测试 生理心理游戏评估 游戏化游戏 全美社交游戏规模 美国社交游戏市场 全球平板电脑出货量 Facebook虚拟商品收益 Facebook全球广告营收 Facebook广告营收 失败游戏设计的数宗罪名 休闲游戏设计要点 玩游戏可提高认知能力 玩游戏与认知能力 全球游戏广告 独立开发者提高工作效率的100个要点 Facebook亚洲用户 免费游戏的10种创收模式 人类大脑可下载 2012年最值得期待的20位硅谷企业家 做空中概股的幕后黑手 做空中概股幕后黑手 苹果2013营收 Playfish社交游戏架构

微博删帖机制分析 发表评论(0) 编辑词条

目录

删帖机制分析编辑本段回目录

新浪微博是中国最大最流行的微博平台,注册用户据说达到了五亿,基本上每个中国网民都注册了一个帐号。不同于西方的Twitter,新浪微博必须承担起审查任务。休斯顿莱斯大学的研究人员收集了数百万帖子,分析和识别新浪微博审查员(或者叫微博小秘书)的规模和删贴速度。论文(PDF)发表在预印本网站arxiv上。研究人员观察到,三成的删贴活动发生在发帖后5到10分钟内,九成的删贴发生在24小时内。假设新浪微博的一个审查员平均每分钟能阅读50个帖子,那么扫描每分钟涌入的7万新帖子新浪需要有1400人同时工作,假设他们每天工作8小时,那么需要有4200人才能满足审查需要。


Reuters
上海,一名男子用iPhone访问新浪微博。

鉴于微博API的限制,研究人员主要跟踪了最可能会发敏感帖子的敏感用户组。从2012年7月20日到9月8日,研究人员利用API以每分钟一次的频率搜索3500位用户的时间线,以每四秒一次的频率搜索公共时间线。由于新浪微博不支持匿名查询,所以他们利用Tor隐藏IP后创建虚假用户帐号。他们共收集了238万用户时间线帖子,删贴率是12.75%。考虑到新浪需要处理的大数据集规模,发帖后5到10分钟的删贴峰值,尤其是考虑到删贴无法完全用自动方式处理,新浪是如何做到迅速发现和删除敏感帖子?研究人员提出了六个假说:

1.新浪微博有一个监视关键词列表,审查员将会浏览包含这些关键词的帖子决定是否删除。

2.微博有针对性的监视频繁发敏感帖子的用户。

3.在发现一个敏感帖子之后,审查员可以追溯所有相关的转贴,可以一次性的全部删除。

4.通过关键词搜索,微博删除了追溯的帖子导致了特定关键词在短时间内出现删除峰值。

5.审查员工作是分布式的,相对独立,其中部分人可能是兼职。

6.删贴速度与主题有关,根据主题的敏感度删除速度存在差异。研究人员利用自然语言处理技术进行删贴主题分析,发现某些热门主题帖子比另外一些主题更快被删除(如图所示),如群交、北京暴雨死亡人数和司法独立等都在极端时间内删除了。

研究人员总结了微博的过滤机制,其中主动过滤机制包括:显式过滤,微博通知发贴人他们的帖子内容违反了内容政策(但有些时候用户并不清楚到底是因为什么敏感词受阻);隐式过滤,微博需要在手动审查帖子后才会允许帖子上线;伪装发帖成功,其他用户看不到这位用户的帖子。

来源:虎嗅网

报告:中国互联网审查效率编辑本段回目录

国社交媒体的审查人员从来都不睡觉,不过在夜深人静的时候,他们的工作效率也会打些折扣。

这是一份新研究报告的若干发现之一,报告作者为独立研究员祝涛(音)和几位研究中国人气颇高的新浪微博SINA+1.80%审查方式的美国学者。

通过对2012年7月至9月期间那些曾违反审查规定的用户在微博上发布的238万个帖子进行分析研究,报告列出了很可能为新浪“编辑”团队采用的审查方式。这个团队是全球监控社交媒体最大规模行动的核心力量。

虽然背审查黑锅的一般来说都是中国宣传部门,但实际上,真正对网络内容“下手”的是中国国内互联网公司本身,而中国政府只是在它认为这些公司没有做好这一工作时才采取行动。

作为中国社交媒体网站中最活跃、政治气氛最浓厚的平台,新浪微博在源源不断地输出敏感帖子。让很多正在研究中国政府审查实践的学者印象深刻的是,新浪审查团队管控这些帖子时速度和效率都高得惊人。

报告说:在我们的数据集中,有5%的帖子在出来后的8分钟内被删除,近30%的帖子在30分钟内被删除,考虑到微博处理的数据集规模之大,这个速度实在太快了,特别是在5到10分钟的高峰时段,特别是考虑到这项工作无法以全自动的方式来完成。

报告说,微博上平均每分钟有7万条帖子发布,这种情况下,审查人员很可能会使用含有敏感词的不同列表,同时关注那些很可能会说出敏感词语的用户,这样就能助过滤系统一臂之力。审查人员发现他们认为应该被过滤的词后,他们首先会删除原帖,然后搜索所有转发帖,将其一网打尽,通常五分钟内就能完成工作。

被新浪审查团队盯上而删除的帖子中,82%是转发帖。

研究人员发现,有10%的被删帖是在发布24小之后被删除的。其中大多数帖子使用了新词或逃避自动关键词过滤的暗语。例如,重庆市前市委书记薄熙来去年倒台丑闻爆出的时候,微博用户为绕开对薄的屏蔽,用“西红柿”指代他,其中“西”与他名字中的“熙”字同音。

最终这些暗语会被发现且屏蔽,从而导致新暗语的产生,然后再度被屏蔽,如此循环往复。

报告作者说,由于审查人员不断发现新暗语,他们会使用关键搜索词来回溯,然后很快删除相关帖子。例如,他们发现有44条不同的微博中使用了新发现的敏感性暗语,然后在区区五分钟内就将其全部删除。

若有用户一再公然发布敏感内容,新浪有时会直接将其销户。在报告研究的3.5万个账户中,有300个账户有如此遭遇。

不过,尽管新浪审查人员警惕性很高,但他们似乎也是要休息的。研究发现,审查工作虽然一天24小时不停歇,但凌晨那几个小时会有一段“风平浪静”的时光。报告说,上午的删帖高峰时段表明,审查人员的进度有所落后,他们一边要翻看前晚的帖子,一边还要处理上午发的新贴,然后到接近中午或午后不久他们就赶上进度了。

对微博用户来说,他们发的帖子越敏感,审查人员上午的压力就越大,或许这一点能令他们感到欣慰。但据去年11月发布的另一份报告统计,大多数时候,审查人员是最终的赢家。这份报告与上述报告出自同样一群作者之手。

较早的那份报告说,审查一开始,某话题的讨论频率会明显降低。报告作者将审查人员比作是白血球。

报告说,生物免疫系统的工作重点不是尽快达到零感染的水平,而是阻止传染物扩散并干扰到生物体的健康;微博的审查重点似乎同样务实,只要敏感话题没有大规模传播,一些敏感帖子在某段时间内是可以被容忍的。

Paul Mozur

→如果您认为本词条还有待完善,请 编辑词条

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
0

标签: 删帖机制分析 新浪微博审查方式 新浪审查团队 新浪微博删帖机制分析

收藏到: Favorites  

同义词: 新浪微博审查方式,新浪微博删帖机制,新浪微博删帖机制分析,新浪微博审查团队

关于本词条的评论 (共0条)发表评论>>

对词条发表评论

评论长度最大为200个字符。