因为最终修改的文本范围太大,如果延续第九版的版本号,就容易出现混淆的问题。又希望这个版本在客观错误数量方面接近十全十美,所以这次更新就把版本号变成了第十版。
这次修改的第十版,可以说把《隐杀》最后、最大范围的问题解决了,就是一直逗号没有句号的大长句问题。不过解决这个问题可不容易,因为错字可以用语音朗读听出来大部分,但是标点符号就只能用其他方法校对了。这次我先花了10天时间把200万字的《隐杀》分成3000字一段的文本过了一遍文心一言4.0大模型AI工具,用于查找隐藏很深的同音错字以及标点符号的错误,虽然已经严格要求不修改原文用词和换行,只重点检查错字、多字或少字、标点符号的使用错误和缺失。还是不可避免返回来的文本和原文有不少改变,虽然大部分都是偏正面的修正,也找到了不少遗漏的错字,但也有大量破坏原文的和谐修改和AI新加上的错误,至于排版被破坏倒是小问题。
这是一开始就想到的问题,AI不可能完整按照要求查找错误。然后我就开始在对比软件BCompare上用第九版Ver1.1的文本人工逐条修正第十版,这个过程持续了30天。
至于为什么要这么久,因为返回来的文本已经和第九版Ver1.1版文本有4328差异部分。这里解释一下这个数字的含义,比如在100条需要换行的文本里,出现在35行文字里有一处或多处和原文不同就算1差异部分,如果在相邻的文字行里,如34行和36行也有不同,就会和35行里的不同算在1个差异部分里。如果是不相邻行数里的不同,就会算2差异部分,最后算200万字的文本被分出了多少有差异的区域。之前帖子里第七版和第九版的差异数据也是这样计算的,并不是单纯修改点的数量。
逐条修正完成以后就可以直接发出来了,但是现在发出来的第十版文本,并不是我通读一遍的文本,后续找时间会重新读一遍小说。之所以要通读一遍,是因为逐条修正以后,有可能出现连续可读节奏方面的问题。比如逗号或句号以及断句过于频繁,这个问题可以用正常语速的语音朗读听出来的。当我读到错误和不合适的断句时候我会进行适当修改,所以会不定期更新修订文本,但是版本号不会变了。
这次修改的第十版的剧情和第九版Ver1.1没有任何区别,因为是最后一次大范围动文本,已经不想折腾剧情了。最终第十版和第九版Ver1.1差异有4115部分,第十版的字数比第九版Ver1.1多了3807个,同时第十版比第七版字数多了10265个。
最后说一下不同版本的大概差异。第七版是最后一版完全按照原版文本校对的文本,如果不想看我个人修改过剧情的就看这个版本就好。第八版是在第七版的基础上修改了一些剧情的版本,只是修改的比较粗糙,已经不提供文本了。第九版是在第八版基础上润色了全部修改的剧情的版本,具体请看之前第九版的帖子。