因翟天临而裹进“开年大戏”的知网被指垄断 学术界怎么看?【马哥教育新闻快报363期】

各位小伙伴下午好,今天是2019年2月20日,这里是马哥教育新闻快报363期。

本期重点关注: 因翟天临而裹进“开年大戏”的知网被指垄断 学术界怎么看?

【快报内容】

1、 因翟天临而裹进“开年大戏”的知网被指垄断 学术界怎么看?

因翟天临而裹进“开年大戏”的知网被指垄断 学术界怎么看?【马哥教育新闻快报363期】

  翟天临在直播中的一句“知网是什么东西啊”,推倒了“学术打假”多米诺骨牌的第一块,也让知网被裹进了这场“开年大戏”。围绕知网垄断所展开的持续多年的质疑,也再次成为公众话题。

  知网全称为“中国知网”,是我国最大的文献数据库,其收录的文献总量超过 2 亿篇。可以说,只要用中文做学术,你就绕不开知网。

  18 日,浙江工商大学人文与传播学院网络新媒体(编辑出版)系主任沈珉在有问 APP 主办的论坛上坦言,从高校图书馆和学术期刊的反馈来看,知网的垄断是不争的事实。“我们并不关注垄断本身,更关注垄断对于知识服务的影响。”

  知网的性质决定其具有一定垄断地位

  有媒体发现,根据知网母公司同方股份公布的 2018 年半年度财报,知网毛利率高达 58.83%。

  华东政法大学副教授倪静说,知网的服务几乎年年都在涨价,但大多数图书馆仍选择继续使用,用户的议价能力非常弱。“这说明,知网具有较强的控制相关市场的能力。”

  其透露,知网收录文章时,若直接从原作者处收录优秀硕士学位论文,知网仅支付数十元人民币的现金稿酬或其发行的阅读卡。知网提供的论文下载服务帮助其获取巨额利润,但文章真正的作者不能从中拿到分毫,而且,作者从知网下载自己的文章时,还需继续付费。“我认为这也损害了文章作者的权利。”

  知网是我国知识基础设施工程的一部分。其前身为中国期刊网,建设本身得到了教育部、科技部等多个国家部委的支持。苏州大学法学院教授张鹏说,知网的性质决定了其具有一定的市场垄断地位。既然是国家知识基础数据库,知网承担着将文献资料予以数据化的重任,获得一定的政策便利,具有合理性。

  “但对于知网的垄断性市场地位,国家应当给予强有力的干预和调节,知网也应当承担更多的社会责任 。”从知识共享、数据库构建的角度来说,要求数据库收录期刊发表的论文,有其正当性。但是,数据库对作者没有或只支付极少版税,是否合理?数据库对外提供查询下载服务时,价格虚高,是否恰当?“而且,作为公共企业,知网也应该主动提高它的社会服务水平。”张鹏说。

2、 斗鱼传申请赴美上市 募资5亿美元抢滩直播市场

21 世纪资本研究院研究员饶守春

  继虎牙直播(HUYA.N)和映客(3700.HK)后,斗鱼将有望成为第三家登陆资本市场的直播平台公司。

  近日,多家媒体报道称,斗鱼已秘密申请在美国市场 IPO,本次 IPO 将计划融资约 5 亿美元,且预计最早今年二季度实现上市。

  21 世纪资本研究院了解到,斗鱼早有 IPO 上市计划,此前有高管即表态已在计划筹备中。去年上半年,更多有斗鱼拟赴港上市的消息传出。

  2 月 19 日,斗鱼相关媒体负责人回应表示,针对公司 IPO 事宜目前暂不作回应,也没有更多信息披露。

  尽管目前无法确认斗鱼是否已经启动上市计划,但外界认为,随着虎牙直播等平台相继上市,同作为行业头部企业的斗鱼只有依赖上市融资,才能继续维持其市场地位。

  但随着宏观经济调整以及内容监管的趋严,直播行业也被认为已经出现拐点,“行业寒冬论”屡被提及,这对还未上市的斗鱼而言,无疑是个巨大的挑战。

3、 马斯克称特斯拉年底将拥有完整无人驾驶汽车技术

特斯拉首席执行官伊隆·马斯克(Elon Musk)周二预计,到今年年底,这家电动车制造商将拥有无人驾驶汽车所需的基本技术。

  这位企业家与方舟投资(ARK Invest)的凯茜·伍德(Cathie Wood)和塔莎·基尼(Tasha Keeney)共同参加一场播客活动时发表了上述评论。方舟投资是特斯拉的股东之一。特斯拉的自动驾驶辅助系统(Autopilot)因其功能的复杂性而受到积极关注,并因与多起备受瞩目的事故有关而受到负面关注。

  马斯克表示:“我认为今年我们将实现完全自动驾驶。这意味着,今年,特斯拉电动车可以在停车场找到你,把你接上车,一路带你到目的地,而不需要任何干预。我敢说,这一点我是肯定的。”

  这与马斯克此前在特斯拉第四季度业绩电话会议上所作的评论是一致的。

  “然而,”他补充说,“人们有时会推断,这意味着现在它的工作百分之百肯定,不需要观察,表现堪称完美。事实并非如此。”

  马斯克补充说,这项技术进入客户手中的速度取决于监管机构允许的速度。在两年内,这项技术应该可以让汽车在没有任何司机帮助的情况下运行。

  “我的猜测是,我们什么时候会认为某人基本上睡着了,然后在目的地醒来是安全的?可能在明年年底,那是我认为这样做足够安全的时候,”他说。

4、 欧空局“鱼叉”清理太空垃圾试验成功 可成超级武器破坏对手卫星

日前,欧空局“碎片清理”(RemoveDebris)项目试验取得成功,卫星发射“鱼叉”成功捕获目标。该技术为太空垃圾清理提供了新途径,但其潜在军事价值也让人“毛骨悚然”。

  空客公司发布的试验视频显示,模拟太空垃圾的铝片挂在由卫星伸出的碳纤维吊杆上,卫星瞄准发射一枚钢笔大小的“鱼叉”,“鱼叉”成功穿透铝板并将其拖回卫星。空客公司负责试验的高级工程师阿拉斯泰尔·韦曼表示,“鱼叉”以每秒 20 米的速度击中目标,尖端穿透铝板后,弹簧结构上的倒钩将铝板牢牢固定。

  “碎片清理”项目旨在探索多种太空垃圾捕获、清理技术,卫星平台由英国萨瑞大学主导并提供,钛合金“鱼叉”等捕获设备则由空客公司英国分部设计制造,法国阿丽亚娜集团和瑞士微电子公司也参与其中,欧空局为该项目的幕后“金主”,出资 1870 万美元。

  2018 年 4 月 2 日,试验卫星搭乘太空探索技术公司(SpaceX)“猎鹰”火箭进入国际空间站;6 月 22 日,试验卫星由国际空间站释放入轨;9 月 16 日,“碎片清理”项目成功完成首次“渔网”捕获试验,卫星首先释放一颗小型“立方星”,再从 6 米外发射拦截网将其捕获,这是人类历史上首次空间垃圾主动清理技术在轨试验。

  按照计划,2019 年 3 月试验卫星将展开减速“风帆”,试验卫星的加速离轨技术。“风帆”将显著提升卫星所受的稀薄大气阻力,加速卫星轨道衰减,预计在不到 10 周时间就会进入大气层烧毁。

  “碎片清理”项目为人类清理太空垃圾、提高太空任务安全提供了有效途径。但这种看似“人畜无害”的“垃圾清理技术”却潜藏着骇人的军事价值。“鱼叉”和“渔网”既可充当太空清洁工,也能成为“超级武器”破坏对手卫星。随着这些技术逐渐趋向成熟,太空武器的“潘多拉魔盒”或将最终打开。

  总编辑圈点

  科幻电影《地心引力》中说,太空碎片撞击了空间站,导致连锁破坏,摧毁了人类在绕地轨道上的所有基地。多如牛毛的碎片是宇航员的心头大患,还没办法清除这些垃圾悬浮物。将来凭借着新颖的设计,我们或能勉强管住它们。但就像电影警示的,初始危险可能来自于无序的太空竞争。维护太空安全需要各国携手。

【今日学习必备】

【Linux面试真题】- 在DNS系统测试时,设named进程号是53,通过什么命令通知进程重读配置文件?

A 、kill –USR2 53

B 、kill –USR1 53

C 、kill -INT 63

D 、kill –HUP 53

正确选项:D

【Python面试真题】- 常见的反爬虫和应对方法?

1).通过Headers反爬虫

从用户请求的Headers反爬虫是最常见的反爬虫策略。很多网站都会对Headers的User-Agent进行检测,还有一部分网站会对Referer进行检测(一些资源网站的防盗链就是检测Referer)。如果遇到了这类反爬虫机制,可以直接在爬虫中添加Headers,将浏览器的User-Agent复制到爬虫的Headers中;或者将Referer值修改为目标网站域名。对于检测Headers的反爬虫,在爬虫中修改或者添加Headers就能很好的绕过。

2).基于用户行为反爬虫

还有一部分网站是通过检测用户行为,例如同一IP短时间内多次访问同一页面,或者同一账户短时间内多次进行相同操作。

大多数网站都是前一种情况,对于这种情况,使用IP代理就可以解决。可以专门写一个爬虫,爬取网上公开的代理ip,检测后全部保存起来。这样的代理ip爬虫经常会用到,最好自己准备一个。有了大量代理ip后可以每请求几次更换一个ip,这在requests或者urllib2中很容易做到,这样就能很容易的绕过第一种反爬虫。

对于第二种情况,可以在每次请求后随机间隔几秒再进行下一次请求。有些有逻辑漏洞的网站,可以通过请求几次,退出登录,重新登录,继续请求来绕过同一账号短时间内不能多次进行相同请求的限制。

3).动态页面的反爬虫

上述的几种情况大多都是出现在静态页面,还有一部分网站,我们需要爬取的数据是通过ajax请求得到,或者通过JavaScript生成的。首先用Fiddler对网络请求进行分析。如果能够找到ajax请求,也能分析出具体的参数和响应的具体含义,我们就能采用上面的方法,直接利用requests或者urllib2模拟ajax请求,对响应的json进行分析得到需要的数据。

能够直接模拟ajax请求获取数据固然是极好的,但是有些网站把ajax请求的所有参数全部加密了。我们根本没办法构造自己所需要的数据的请求。这种情况下就用selenium+phantomJS,调用浏览器内核,并利用phantomJS执行js来模拟人为操作以及触发页面中的js脚本。从填写表单到点击按钮再到滚动页面,全部都可以模拟,不考虑具体的请求和响应过程,只是完完整整的把人浏览页面获取数据的过程模拟一遍。

用这套框架几乎能绕过大多数的反爬虫,因为它不是在伪装成浏览器来获取数据(上述的通过添加 Headers一定程度上就是为了伪装成浏览器),它本身就是浏览器,phantomJS就是一个没有界面的浏览器,只是操控这个浏览器的不是人。利selenium+phantomJS能干很多事情,例如识别点触式(12306)或者滑动式的验证码,对页面表单进行暴力破解等。

>【就业喜讯】

【学员喜讯-774期】- 学了马哥教育Linux网络班和Python网络班,今年26岁,面试高级运维,薪水23K!offer收到手软!

因翟天临而裹进“开年大戏”的知网被指垄断 学术界怎么看?【马哥教育新闻快报363期】

【今日直播】

1、60分钟掌握Linux云计算平台安全架构设计(10:30-11:00)

2、小白怎样通过应用快速学习Python技术体系(15:00-16:30)

【近期开班】

Linux面授班:2019年3月4日(北京)
Linux网络班:2019年3月16日(网络)
Python面授班:2019年3月18日(北京)
Python网络班:2019年3月30日(网络)



相关新闻

历经多年发展,已成为国内好评如潮的Linux云计算运维、SRE、Devops、网络安全、云原生、Go、Python开发专业人才培训机构!