伊利诺伊大学法学院教授 麦克莱恩:标准文本及其对证券市场信息披露的影响(八)
- 管理员
-
28 次阅读
-
0 次下载
-
2020-10-20 11:13:31
文档简介:
伊利诺伊大学法学院教授麦克莱恩:标准文本及其对证券市场信息披露的影响(八)2020-09-04笔者以文本或HTML格式从SEC的EDGAR在线数据库下载了每个发行人的招股说明书。为了分析,笔者使用了包含招股说明书初步版本的S-1初始申请文件,因为,此版本的招股说明书是初始投资者最有可能看到的。笔者还收集了根据第424(b)条规则提交的每份招股说明书最终版,[119]以及其间的每个修订版本。[120]然后我将这些样本处理为分析用样本。[121]这包括消除图表内容、标点符号和连接词,如冠词、人称代词和经常出现但提供很少实质信息的连词。[122]在语言处理中,删除连接词是标准做法,因为研究发现这些词无助于文本分析。[123]对于所有HTML文档,笔者删除了标签和其他HTML代码。对于所有文档,还删除了包含数字信息的表格,因为这些表格不容易比较,并且在任何情况下都不是SEC表示关注的标准文本的来源。最后,每个单词都还原为词根词——任何单词的词尾都被删除了,并且这个单词被还原为它的词根,这是文本处理中的标准做法。[124]除了文本数据,笔者还收集了每宗发行的其他相关数据,从Compustat数
评论
发表评论