关闭广告
晋江论坛网友交流区碧水江汀
主题:质疑“盗文网差异”一说 [84]
收藏该贴
已收藏
只看楼主
一、客观要素
1.1 数据收集:数据收集的过程非常重要,数据决定实验结果差异,广大盗文网都是利用爬虫来爬取盗文,而低成本运营的网站并不会提高技术用来专门爬取正版网站的文章,他们爬取的大都是完结文包和高成本运营的网站盗取的内容,故完结文的替换数据无参考性。其次,那些真正有实力爬取正版文章的网站是否被隔壁楼主罗列出来?隔壁楼主是否清楚哪些网站是罪恶之源?那些域名相似的一看就出于同一站主之手的网站是否有重复或参考性?

1.2 实际操作:与数据收集类似,我不知道隔壁楼主打盗文的程度是什么样的,那我来说一下我自己吧。为了打盗,我手机和电脑里有不下五个浏览器,每个浏览器的搜索算法都不一样,甚至不同浏览器同一个搜索引擎出来的都不一样,不同设备的更不用说了,请问隔壁楼主清楚吗?是否每个浏览器都进行了广泛的数据收集?我的社交软件上存了几十个盗文狗各种账号,时时刻刻准备举报,那么你们清楚这些人手中的文包是从何而来吗?知道现在某大网站已经不是最大的源头了吗?

1.3 样本严重不足:同1.1,在缺乏样本的情况下如何进行数据分析?得出来的是普遍一般性的结果吗?连容错的空间都做不到,连排除误差都无可能,甚至隔壁楼主贴出来的内容是人工【手动】筛选的数据——我们做实验的时候,为了实验结果好看,难道要把感觉不好的数据手动剔除出去保证最终的实验结果吻合预设吗?那科学性和公平性在哪里?我看了一下隔壁帖子给出的表格,耽美4本,衍耽1本,言情3本,衍言1本,二言1本,衍无1本,原无1本,共计12本。

二、主观要素
2.1 数据解释非常主观,本质的目的是“伸冤”而非讲事实。这条在统计学中本属于数据分析,但很明显涉及人的情绪,那我就放在主观要素里说。请问在发了主楼后,下面跟帖的人有无自己再去网站上搜索后得出数据佐证隔壁楼主的观点?到底是看见有人“澄清”“伸冤”了赶紧出来鸣不平,还是为了维护共同的网站,希望网站向好发展?我记得那位百合作者发出质疑帖子后,不管是BS还是读者区,都有人立刻找出证据进行论证吧?

2.2 针对隔壁楼中说的“没有不公平”这一说:除了盗文之外,还有哪点公平的?是榜单公平?还是系数公平?是签约公平?还是V线公平?一个以“公平”著称的网站,处处都不公平,网站是主责毋庸置疑,既得利益者为何总在别人维权的时候胡搅蛮缠?为何每次有人维权,就有人和g3打闹嬉笑?为何每次有人指责网站不作为,就有人出息事宁人?

2.3 请问那天在那位百合作者的楼中辱/骂她、说她ruo/z的言情作者道歉了吗?请问在楼里发表“耽美读者都看盗文”的言情作者给看耽美的读者道歉了吗?请问明明是权重系数导致耽美小说在夹子上排行低,那么言情作者为何依然孜孜不倦、口口声声地说耽美的收订差呢?一个以耽美起家的文学网站,最终进化的结果就是它手下的作者公然打腐吗?前面的帐没有清完,怎么一下子就揭过去开始给自己“伸冤”了呢?明星想岁月史书,想以B案件胜诉澄清A“谣言”的时候,还知道要隔一段时间,而今天距离事件开始都不超过一周,这么快就全忘了?

三、关于这个质疑贴
为何质疑“澄清贴”而不质疑那位百合作者的帖子,因为那个帖子本身也是质疑,没有以质疑质疑质疑的道理,质疑本身不需要完全充分且完美的论据,而网站有义务回答一个签约作者这个问题,因为合同上并没有写明白,最后g3以含糊的言语回复了这位作者的质疑。我知道有些人喜欢解读g3的话说g3没有给言情特权,但是这跟我的帖子无关,不管g3说了什么,我都可以对这位言情作者得出的“确切结论”进行质疑,因为这个帖子是给出了【是因为盗文网站不同,所以V文替换的情况不同】这个结论。
№0 ☆☆☆I1lIlIlI|105dfe43 2025-12-18 01:37:51留言☆☆☆   来自河南 加书签 投诉 不再看TA

一、客观要素
1.1 数据收集:数据收集的过程非常重要,数据决定实验结果差异,广大盗文网都是利用爬虫来爬取盗文,而低成本运营的网站并不会提高技术用来专门爬取正版网站的文章,他们爬取的大都是完结文包和高成本运营的网站盗取的内容,故完结文的替换数据无参考性。其次,那些真正有实力爬取正版文章的网站是否被隔壁楼主罗列出来?隔壁楼主是否清楚哪些网站是罪恶之源?那些域名相似的一看就出于同一站主之手的网站是否有重复或参考性?
1.2 实际操作:与数据收集类似,我不知道隔壁楼主打盗文的程度是什么样的,那我来说一下我自己吧。为了打盗,我手机和电脑里有不下五个浏览器,每个浏览器的搜索算法都不一样,甚至不同浏览器同一个搜索引擎出来的都不一样,不同设备的更不用说了,请问隔壁楼主清楚吗?是否每个浏览器都进行了广泛的数据收集?我的社交软件上存了几十个盗文狗各种账号,时时刻刻准备举报,那么你们清楚这些人手中的文包是从何而来吗?知道现在某大网站已经不是最大的源头了吗?

1.3 样本严重不足:同1.1,在缺乏样本的情况下如何进行数据分析?得出来的是普遍一般性的结果吗?连容错的空间都做不到,连排除误差都无可能,甚至隔壁楼主贴出来的内容是人工【手动】筛选的数据——我们做实验的时候,为了实验结果好看,难道要把不好的数据手动剔除出去保证最终的实验结果吻合预设吗?那科学性和公平性在哪里?我看了一下隔壁帖子给出的表格,耽美4本,衍耽1本,言情3本,衍言1本,二言1本,衍无1本,原无1本,共计12本。

二、主观要素
2.1 数据解释非常主观,本质的目的是“伸冤”而非讲事实。这条在统计学中本属于数据分析,但很明显涉及人的情绪,那我就放在主观要素里说。请问在发了主楼后,下面跟帖的人有无自己再去网站上搜索后得出数据佐证隔壁楼主的观点?到底是看见有人“澄清”“伸冤”了赶紧出来鸣不平,还是为了维护共同的网站,希望网站向好发展?我记得那位百合作者发出质疑帖子后,不管是BS还是读者区,都有人立刻找出证据进行论证吧?
2.2 针对隔壁楼中说的“没有不公平”这一说:除了盗文之外,还有哪点公平的?是榜单公平?还是系数公平?是签约公平?还是V线公平?一个以“公平”著称的网站,处处都不公平,网站是主责毋庸置疑,既得利益者为何总在别人维权的时候胡搅蛮缠?为何每次有人维权,就有人和g3打闹嬉笑?为何每次有人指责网站不作为,就有人出息事宁人?
2.3 请问那天在那位百合作者的楼中辱/骂她、说她ruo/z的言情作者道歉了吗?请问在楼里发表“耽美读者都看盗文”的言情作者给看耽美的读者道歉了吗?请问明明是权重系数导致耽美小说在夹子上排行低,那么言情作者为何依然孜孜不倦、口口声声地说耽美的收订差呢?一个以耽美起家的文学网站,最终进化的结果就是它手下的作者公然打腐吗?前面的帐没有清完,怎么一下子就揭过去开始给自己“伸冤”了呢?明星想岁月史书,想以B案件胜诉澄清A“谣言”的时候,还知道要隔一段时间,而今天距离事件开始都不超过一周,这么快就全忘了?
三、关于这个质疑贴
为何质疑“澄清贴”而不质疑那位百合作者的帖子,因为那个帖子本身也是质疑,没有以质疑质疑质疑的道理,质疑本身不需要完全充分且完美的论据,而网站有义务回答一个签约作者这个问题,因为合同上并没有写明白,最后g3以含糊的言语回复了这位作者的质疑。我知道有些人喜欢解读g3的话说g3没有给言情特权,但是这跟我的帖子无关,不管g3说了什么,我都可以对这位言情作者得出的“确切结论”进行质疑,因为这个帖子是给出了【是因为盗文网站不同,所以V文替换的情况不同】这个结论。
№1 ☆☆☆I1lIlIlI|105dfe432025-12-18 01:40:56留言☆☆☆   来自河南
投诉 加书签 引用 不再看TA

bd
被屏了可以把主楼加书签,在收藏里看。
我看那个楼的时候就感觉哪里不对劲,但是脑子笨嘴笨,感谢楼主提出质疑!支持每一位敢于质疑的勇者。
№2 ☆☆☆抄写三十天|7efbf7ac2025-12-18 01:41:30留言☆☆☆   来自山西
投诉 加书签 引用 不再看TA

dd
№3 ☆☆☆一六八星|cb5776292025-12-18 01:45:51留言☆☆☆   来自广西
投诉 加书签 引用 不再看TA

楼主要不要试试放图
№4 ☆☆☆抄写三十天|7efbf7ac2025-12-18 01:45:58留言☆☆☆   来自山西
投诉 加书签 引用 不再看TA

ddd,可以便签转图,然后小程序搜绿小贝图/不图啥这俩任一图床,我看到了楼主质疑的点来着,写得很好哈
№5 ☆☆☆IiIIioIiI|0b84231e2025-12-18 01:49:08留言☆☆☆   来自广东
投诉 加书签 引用 不再看TA

1
№6 ☆☆☆I1lIlIlI|105dfe432025-12-18 01:51:35留言☆☆☆   来自河南
投诉 加书签 引用 不再看TA

2
№7 ☆☆☆I1lIlIlI|105dfe432025-12-18 01:52:30留言☆☆☆   来自河南
投诉 加书签 引用 不再看TA

3
№8 ☆☆☆I1lIlIlI|105dfe432025-12-18 01:53:38留言☆☆☆   来自河南
投诉 加书签 引用 不再看TA

顶顶
№9 ☆☆☆88240266|90744916★★★2025-12-18 01:56:22留言☆☆☆   来自重庆
投诉 加书签 引用 不再看TA

dd
№10 ☆☆☆无边青木|9f1efc352025-12-18 01:56:50留言☆☆☆   来自马来西亚
投诉 加书签 引用 不再看TA

看了那篇帖子后我只感受到了【情绪】而非合理的数据佐证,所以我写了这篇质疑帖子,从两个角度质疑,如有错漏可以补充/追加质疑。
№11 ☆☆☆I1lIlIlI|105dfe432025-12-18 02:04:03留言☆☆☆   来自河南
投诉 加书签 引用 不再看TA

lz真的很理智地陪他们胡闹,可惜他们太情绪上头了,只能听见自己爱听的话
№12 ☆☆☆抄写三十天|7efbf7ac2025-12-18 02:07:07留言☆☆☆   来自山西
投诉 加书签 引用 不再看TA

所以搞了半天只查了四本书?还是四个网站?当时那个楼主的结论是查了多少本来着?至少四五十本吧,我记得好长一条。
№13 ☆☆☆写点吧咕|254d56f3★★★2025-12-18 02:07:34留言☆☆☆   来自云南
投诉 加书签 引用 不再看TA

所以搞了半天只查了四本书?还是四个网站?当时那个楼主的结论是查了多少本来着?至少四五十本吧,我记得好长一条。
№13☆☆☆写点吧咕|254d56f3于2025-12-18 02:07:34留言☆☆☆

这个样本数据,哪怕写期末论文都是不及格的啊。
№14 ☆☆☆写点吧咕|254d56f3★★★2025-12-18 02:08:12留言☆☆☆   来自云南
投诉 加书签 引用 不再看TA

lz真的很理智地陪他们胡闹,可惜他们太情绪上头了,只能听见自己爱听的话
№12☆☆☆抄写三十天|7efbf7ac于2025-12-18 02:07:07留言☆☆☆

我知道她们胡闹,但是那个帖子很明显在岁月史书,我想我有必要发一个这样的帖子出来,以防到未来又被倒打一耙说是JJ的耽美作者欺负排挤言情作者。
№15 ☆☆☆I1lIlIlI|105dfe432025-12-18 02:08:49留言☆☆☆   来自河南
投诉 加书签 引用 不再看TA

这个样本数据,哪怕写期末论文都是不及格的啊。
№14☆☆☆写点吧咕|254d56f3于2025-12-18 02:08:12留言☆☆☆

数据训练的时候,十个左右的数据都不够数据处理时剔除或误差分析里放入误差计算的。
№16 ☆☆☆I1lIlIlI|105dfe432025-12-18 02:09:47留言☆☆☆   来自河南
投诉 加书签 引用 不再看TA

另外,抛去衍言不谈,隔壁楼主自己统计出来的数据里,言情被替换内容出现的频次为【6】,其余频道均为0,甚至耽美文里有一本出现了【V后正确】,请问您自己的数据能佐证您给出的结论吗?
№17 ☆☆☆I1lIlIlI|105dfe432025-12-18 02:17:33留言☆☆☆   来自河南
投诉 加书签 引用 不再看TA

贴图
№18 ☆☆☆I1lIlIlI|105dfe432025-12-18 02:18:10留言☆☆☆   来自河南
投诉 加书签 引用 不再看TA

太晚了,还写了一些,但感觉好像没必要说了,明早起来看看吧,期待回复。
№19 ☆☆☆I1lIlIlI|105dfe432025-12-18 02:26:17留言☆☆☆   来自河南
投诉 加书签 引用 不再看TA

BD
№20 ☆☆☆lIIllIlll1|ce0bf0022025-12-18 02:38:08留言☆☆☆   来自广东
投诉 加书签 引用 不再看TA

登入后查看更多回贴

回复此贴子

名字:
选择图案:
内容:
(注意:一次最多可提交3000字,且一次最多可提交三张尺寸在1024*1024范围内的图片,超出部分请分次提交!)
图片链接:
(贴图规则)


返回上层 管理 返回本版块首页返回交流区首页返回主页

 

只看楼主