200字范文,内容丰富有趣,生活中的好帮手!
200字范文 > 【论文阅读记录】一篇关于地震预测的论文

【论文阅读记录】一篇关于地震预测的论文

时间:2024-06-12 16:28:04

相关推荐

【论文阅读记录】一篇关于地震预测的论文

前言:

{

这几天开始忙了,可能时间没有之前充裕,但是我尽量3天一更吧。

这篇论文的名称是《Machine Learning Predicts Laboratory Earthquakes》(机器学习预测实验室地震)[1],读一读扩充一下视野。

}

正文:

{

第一节,作者先介绍了经典的地震预测方法:基于地震的间隔时间来预测。但是,这种方法在最近的一段时间开始不靠谱了。而且受仪器进步的影响,最近10几年的发现了之前未被识别的地震新现象:慢滑移,低频地震和地球震颤[2],这些新发现可能对预测地震有帮助。并且随着仪器越来越先进,也许最终我们能发现所有地震的先兆。

第二节的标题是材料与方法。在实验室中,当材料受力并接近失效时,它会显示出临界受力形态的相关特征,包括许多小的剪切失效,而从这种不稳定的状态可以推断出一次实验室地震。作者试图使用音频信号来预期失效剩余时间(即在最近一次失效前所剩的时间)。

图1

在图1中,a部分的红线代表要预测的失效剩余时间;b部分的黑线代表用于训练的音频数据,黑线上面的虚线方框代表计算特征的移动窗口,黑线下面的三条线代表三种特征数据,每一个特征数据点由上面的音频数据根据对应的移动窗口而得到;c部分是预测用的随机森林,其对于每个移动窗口输出1000个决策树的预测的平均;d部分是结果对比,蓝线是预测值。

很显然,预测比较成功。不过图1只给出了部分特征数据,实际上作者一共计算过差不多100种特征数据(比如均值,方差,峰度和自相关性),并且之后做了特征筛选。

在[2]中,作者详细介绍了使用的特征和随机森林模型的结构。

使用的特征为:均值、方差、倾斜度、峰度、7个高阶矩、18个百分位数(1-9和91-99)、10个阈值特征(阈值分别为0.000000001、0.000000005、0.00000001、0.00000005、0.0000001和它们*-1)最大幅值和最小幅值、3个傅立叶频域特征(所属频段分别为19.65-20.65kHz、39.8-40.8kHz和80.1-81.1kHz)和2个自相关特征。更详细的特征信息请看[2]。另外,每个移动窗口的数据都被分为两份,所以对于每个训练数据点,都可以得到42*2=84个特征值。

随机森林模型的超参数是由基于3折交叉验证的网格搜索(我还不清楚网格搜索的意思,也许下一次的博客就介绍这个)得到的。随机森林包含1000个树,每个树的每个分支或叶子至少有30个样本,每次特征划分最多考虑40个特征。更详细的模型结构请看[2]。

第三节,作者总结了实验。作者指出,上述模型只使用对应窗口中的数据来预测,而没有使用这前后的数据。作者发现,能够量化输入数据的幅度分布的统计数据(比如方差和高阶矩)对失效预测有很效果,其中方差在最初的时间(离地震还有点时间)是最强特征,替他特征在之后慢慢接近地震发生时间时也渐渐变得有用。

再放一张图。图4是由方差和峰值特征得到的随机森林模型(的输入输出)。

}

结语:

{

可以看到,作者在特征工程上还是下了功夫的,并没有使用深度学习。其实通过搜索(比如在谷歌学术里搜索“deep learning failure prediction”),你也能看到使用深度学习预测灾难或故障的例子,比如使用循环神经网络(门循环单元,GRUs)来预测心衰发作[3],使用循环神经网络(长短期记忆,LSTM)来预测IT系统故障[4]。

很多都是自己的理解,如有错误欢迎指出。

参考资料:

{

[1] https://agupubs./doi/full/10.1002/GL074677

[2] https://agupubs./action/downloadSupplement?doi=10.1002%2FGL074677&file=grl56367-sup-0001-supinfo.pdf

[3] /docs/jamia.pdf

[4] https://sci-hub.tw//abstract/document/7840733

}

}

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。