进行的面试奥利维亚霜2022年2月8日
在这次采访中,大卫·韩起澜博士,博士,PerkinElmer应用科学家,Inc .)谈判AZoM韩起澜的发展回归。
你能介绍你自己和你的工作做什么?
我是大卫韩起澜和我在PerkinElmer工作工具。我开始发展的韩起澜回归的时候我为一家名为Perten工作,PerkinElmer已经购买。我想谈谈韩起澜回归的基本思想和这种类型的分析。
我还将提供一些了解韩起澜与偏最小二乘回归作品,这是一种常见的回归技术经常用于许多领域,包括近红外光谱。韩起澜回归之所以如此吸引人的一件事是它可以用新数据更新的速度有多快。
为什么我们要回归呢?
我们做回归,因为近红外光谱是容易衡量,是化学是困难的部分。所以每当我们可以测量一个直接由近红外化学成分,我们想使用近红外光谱,而不是化学测量。
创建了校准的校准或回归的NIR光谱化学成分有关。这些校准由回归过程简单和便宜。我喜欢的一件事是没有任何危险。你可以喝一杯咖啡在你这样做,和它不创建任何实验室危险。
你能谈谈回归背后的一些想法?
回归线有时被称为最适合或有时最小二乘匹配。如果我们把数据点,看看一个波长的吸光度与吸光度在另一个,你可以看到最好的线穿过它们。这条线通常被称为回归直线。
如果我们有多个维度,那么我们最终回归在多个维度。所以最好的线,我们已经找到了适合的最好的飞机之间的两个变量。本质上与不同的变量,所以样品浓度预计将在这个平面上。
当我们添加更多的维度,我们会从这条线与一维、比较两个东西一个平面,比较三件事立方空间,越来越多的比较,和越来越高的几何图形。
这是什么意思的变量回归?
因此多元线性回归是使用多个变量。多元线性回归一般使用所谓的线性模型。我们希望一切都增加,双打沿线,双打浓度和信号成正比变化。非线性增加一些其他模式,如一个指数。数据符合已知的模式但增长以不同的速度比一条直线。
事实是,当我们处理回归和近红外光谱,我们使用这个线性假设。嵌入在偏最小二乘,例如,线性技术下面的一切。但世界往往是非线性的,所以我们就离开试图把我们的线性模型,我们请并尝试适合一个非线性的情况。当这种情况发生时,回归的结果和校准线不会适应数据以及我们可能会喜欢。
如何校准线和数据之间的一个解决这一问题呢?
我想介绍一个概念是一个哑铃分布的概念。我们所说的发行版,因为他们往往有很多样品在几个地点,没有那么多。
这些你所谓的类内的关系。事实证明,哑铃分布异常请很难处理好,它所有的时间。它特别提出了工厂,正在定义产品,是相互关联的。
这些都是我们所面临的基本问题与我们的校准。大多数工具,请我们在多元线性回归中使用线性和自然不是那么线性的。很多时候我们有组织的产品没有样品之间的回归也很难试图决定是否将解释群体间的距离还是要解释类内差异。
如何解决这一问题的哑铃分布呢?
如果你想有一个很好的相关系数,当你得到一些样品,非常低,和一些非常高,产生的回归线会很长。R的平方或R,然而,你看着它,将是一个重要的数量,但这并不意味着它是解释任何东西,因为大多数的解释是两组之间的差异,而不是发生了什么在这两组。
一旦校准已建成和回归工作开展,值得注意的是,年复一年的回归需要更新过程变化时,当供应变化和作物年变化。
因为事情不断改变,校准并不普遍。校准是由一定的样本集,当我们走出群样本和它们代表什么,事情将会改变。这些问题我在我的工作正面临年复一年。
你怎么离开的陷阱这些模型在一遍遍地吗?
如果你持有一个数学家的真实水平,您可以构建一些奇妙的东西,都是基于事实,总是会帮助你。他们可能不会解决你的问题,但至少你可以确信你构建的工具,这种类型的方法。
我能说的是,如果一件事频谱是相同的,浓度必须相同。每一个方程,请还是安或其他东西,这个属性。我们会说,这个问题是一比一。这个频谱这个答案,不同的光谱可能有不同的答案。理想情况下,问题是一对一的。
真正的问题是,光谱实际上是一样的吗?答案是,他们很少甚至关闭。
我们必须找出如何处理光谱摆脱任何差异。韩起澜回归的基础,我们处理光谱,这是真的。如果频谱是一样的,答案是一样的。它被称为一个之前解决问题。如果我们有之前解决问题,我们如何让更多的是正确的吗?
这是第一份工作,我们做预处理。如果光谱的而不是相同的,我们现在改变这个说,如果使用频谱是相同的,那么浓度必须相同。我们说,它是可以过滤掉散射和颗粒大小不重要的问题,尽量减少问题。
与光谱预处理如何帮助?
一些预处理不删除所有不受欢迎的东西,所以我们依然有许多变化,给出同样的答案,和一些实际上改变真正的光谱信息。
当他们这样做,他们也将可能改变我们的答案。所以这样做的预处理,将消除散射,将和删除基线的转变。这些东西必须比其他人更有用的数据处理。数据处理,证明这一行为是标准的正常变异,de-trending,意味着定心,正交化,类似类型的幂等功能
回到第一原则,有这种想法的预处理,我们要使用会改变光谱,它是相同的其他光谱相同的材料。与仪器配套,颗粒大小,散射效果,光学几何图形。这是一个非常重要的步骤来理解这个。
另一件事发生在回归的意思是成为最确定的位置。当思维是最适合的一条线,我们的错误在回归线。我们不确定你看到的腰,腰上是正确的意思。所以这是最特定的点,当一个样本,我们知道它的浓度必须在这条直线上,加上或减去最少。
相反的思维回归只是一堆数据点与线通过它们,我们考虑回归具有不确定性,最特定点的意思。事实上,据说,如果你不知道任何的意思是如果你想说你要尽可能的情况下。
我们如何利用呢?
已经试过以前的一件事是级联校准。我们有一个校准,在大范围具有一定的精度。然后我们打破成两个校准,将处理单独的范围。然后我们甚至可以这两个分解成两个。
我们共有四个单独的校准。我们的答案基本上ping的第一个,第二个,选择这四个我们应该使用,这给我们结果。人们这样做至少30年近红外领域的,并且可能在其他领域比这长得多的时间。
这个过程处理那些哑铃关系,第一个校准是要单独成哪一组哑铃它属于。下一个将是关注或另一端,这将有助于更好地适应点之间变异性而不是群体间的变异。这是一个有用的技术。
为什么人们不使用这种技术?
人们往往不会使用这种技术,因为它越来越难,使和维护校准。如果你有一个实验室错误当你试图决定哪些样品你应该使用校准,是有限度的,你可以有多少个分歧。你一定可以把事情分成两个。有时你可以把他们分为四个。之后,这取决于你的实验室技术的准确性和数据的变化。
而不是使用单独的校准,每个描绘下一个校准等等,我可以组织数据的频谱。
我知道,如果它有相同的光谱,它必须给同样的答案。所以我采取的飞跃是,如果它有几乎相同的光谱,它应该有一个类似的答案。他们至少应该是相关的。
如果我们只是保持层叠光谱,这些答案变得更好,但也有更多的校准。我看到人们这样做当准确性是至关重要的,但我没有见过很多人认为随着时间的推移。它变得太困难。
有办法保持校准,不会引起太多问题从长远来看吗?
有很多方法,我们可以分手不同的回归,我们可以要求操作员的价值。
我们要求操作员应该事先什么答案然后剩下的校准触摸起来一点。这是它是如何做的,我见过这在许多不同的地方。运营商倾向于把这些渠道。
当你看到所谓的通道蠕变,你开始看到一大堆校准测量同样的东西,只在轻微的产品差异是略有不同的。从本质上说,他们是要求运营商答案应该是什么,然后给他们回来。你与许多不同的产品,许多独立的偏见和追逐这些偏见变成一份全职工作。
然后你会得到错误的答案,没有警告,这是一个错误的答案。仪器没有办法知道如果这额外的信息是否准确。正如我之前所说的,你可以级联校准,你有一个校准规则,然后你选择高低和分开,分开了。你必须保持所有这些。
如果你的实验室有大量的错误,它变得越来越难以决定应该使用哪个校准样品。这是这种方法的限制。如果光谱看起来一样,也许他们是相似的。我们正在采取“相同的频谱相同的答案”的规则包括相似的光谱相似的答案。
韩起澜回归比其他校准技术?
我们已经做了足够的工作说韩起澜回归可以比较合理安在相当多的不同情况下校准。它并不总是更好的,但是它不一定是糟糕的。韩起澜回归的优势相比,安甚至请是很容易创建,而且尤其容易更新。易于更新当你本质上是一个示例并添加其光谱库。
你添加的每一光谱,你需要添加浓度的实验值你感兴趣。当我们新的实验室和浓度添加到库,自动更新韩起澜回归。它不验算校准,使用相同的校准和调整如何计算样本均值基于新的例子。这使得它很容易适应新的情况没有扔掉你之前所做的一切。
可以更新,韩起澜回归就是所谓的学习回归,这意味着我们有一个光谱图书馆和实验室从先前的例子。如果我们再次发现相同的光谱,我们知道它是相同的实验室。它有点像“参考表”。
当我们收集新的光谱和新的实验室和图书馆的不断扩大,我们有更多的例子来比较。我们有了更多的细节,我们继续扩大图书馆。扩大图书馆进化学习被称为一个缓慢的学习过程。我们没有带来一场革命,推翻我们之前所做的。我们只是保证我们好一点,更好一点。
我喜欢韩起澜回归提供了提高精度。我喜欢,它是非常简单的,但是在我看来,学习是关键。这是因为保持校准日期和改变偏见和添加一些更多的校准一个新的季节,很多的工作负载,应用专家。
得知我看过的一些例子包括一个单一的校准使用全麦,也可以为地面工作小麦、大麦、麦芽、面粉和其他面包店混合。这学习完全相反的通道蠕变,而不是将数据分解成越来越多的校准,我们必须保持独立的偏见,如果没有独立的校准,我们最终能够把更多的和更多样化的事情在一起成一个校准。
刚刚一个校准提高近红外测量技术?
你来一个主校准越近,越接近你来做近红外的主要测量技术而不是次要的技术。你得到的根本原因与实验室测量的光谱。
韩起澜回归学习样本高米距离。即样本不符合模型很好或样品高全球h .附近的那些样品不是很多。它可以从他们就添加到库中。
现在,当大多数人正在回归,诱惑是把那些米距离或全球高H样本,使回归没有他们,因为他们往往导致请表现不好,更加注重群体间的距离比到类内变化。
韩起澜回归并没有这样做。它可以在图书馆有这些样品没有他们做校准的更改。你不需要更新校准。当你得到这些样品,你只要将它们添加到库中。这意味着你可以有一个测试和信任的校准,你很自信,它会适应当地条件和不同寻常的样品只是通过添加其中的几个例子。
基本上,韩起澜回归从未停止学习。你可以保持更新并重新校准。
如何保持一个固定的校准时,韩起澜回归正在持续更新?
在谈到更新时,出现的问题对维护校准是偏见。当注意到校准偏差的变化,有必要更新偏差,问这是什么偏差修正?很有可能修复数据集被校准的实验室之间的差异,你现在比较它。偏见是修复工具之间的差异或者是固定在同一仪器不同。
发生了很多的时间,你有一个新的变量,有些事情已经改变了配方和平均你可以说它引起偏见。你把偏见,校准仍将继续运行。客户会很高兴,但是你真的没有解释正在发生的事情。
这是因为当你把光谱,你把它们都视为一组。你不看看分离不同类型的组织,导致一个样本是有偏见的。关键是使用数据调整偏差没有干扰你使用的数据来调整这些样本。
对我来说,修复一个偏见的想法意味着你的校准有问题或者你的仪器或实验室。这并不意味着你固定的任何东西。这意味着你已经介绍了一些。如果你是将样本添加到图书馆和图书馆适应,这实际上是修复,造成的数据集。
也许你可以给我们一个例子,这可能在应用程序设置工作吗?
当使用一个校准在预测不同类型的材料,我们不期望它的工作得很好。所以当我们使用反刍动物校准反刍动物测试集,我们可以看到,支持向量机和韩起澜回归给几乎相同的精度。
在这种情况下,支持向量机是稍微低于韩起澜回归。
请是一个很好的技术。这是给一个合理的答案,但请是不准确的人力资源或支持向量机在复杂问题或复杂的分布。
当我们使用这些校准来预测单胃的提要,支持向量机不是一个不错的选择,但它确实明显优于请或韩起澜回归。如我们所料,如果我们把一个校准,我们使用的东西不像那是什么校准,并没有在图书馆这样的韩起澜回归,它不做得很好。
当添加单胃的反刍动物样品回去给我们的数据集,我们再计算支持向量机校准。我们再计算请校准。
韩起澜回归,我们没有再计算基础反刍校准。我们只是把样本添加到库中。添加了10个样品,我们的单胃的表现并没有改变,我们没有任何改善,除了韩起澜回归。韩起澜回归已经开始慢慢适应的过程。
重要的是要注意,当您添加更多的事情,请校准可以变得更糟。因为你是非线性的添加,添加哑铃分布,请没有很好的处理。我们增加了更多的样品,请在单胃的,因为这些都是在那里,重新计算校准。他们开始有一些影响,但有降低价格,改善准确性与反刍动物。一个更好的,另一个必须变得更糟。这两件事有联系,因为它是一个线性系统。
此时,添加了100样品,你可以看到韩起澜回归适应得很好。
实验室错误,这些影响流程如何?
实验室错误很快来。当添加越来越多的样品,你会反刍动物和单胃的校准数据安,我们做一个校准。安能做的很好,无论是类型的材料。错误是不相同的,因为实验室错误在这些类型的材料是不同的。亚博网站下载
然而,随着韩起澜回归它只做了一个校准反刍动物数据很久以前,,只是使用这些添加实验室样本来获得更好的和更好的。学习不断压低我们的错误,甚至当我们试图预测材料是不完全相同的初始校准。
请,有最大数量的样品,一旦你达到这个数字,事情开始变得更糟。这并不是说有一些神奇的数字,请不能处理。数学不像。
如果你添加越来越多的不同的材料样品,请让妥协。亚博网站下载如果我们把反刍动物和单胃的放在一起,请确实比如果我们让他们分开。
为什么韩起澜回归用于近红外光谱。
世界是绝对不是线性的。那就是说,分组是好的。当我们试图把类似的事情放在一起,学习能力会提高,这将简化问题。我想补充说,学习总是帮助解决问题。
这是让韩起澜回归非常强大的非线性方法。学习,坦白说可以节省很多时间,因为用户不需要不断调整偏差校准或保持更新校准。样品可以添加到图书馆,他们是很好的。
学习也可以说比答案更有价值。学习是一个编译的数据很多不同的东西。我们永远不会完全用材料,那是不工作的方式。我们需要有能力学习新数据,新样品,和智慧提供正确的答案,而无需扔掉一切,从头开始。
关于大卫·韩起澜博士
韩起澜博士毕业,工作的共同监督下教授加里Hieftje和托马斯博士Hirschfeld印第安纳大学布卢明顿。他担任分析化学助理教授华盛顿大学的几年。之后,他在NIRSystems(现在是自由/开源软件的一部分)在近红外光谱仪器。他开始一个公司,卡特里娜inc .)使近红外光谱仪器的过程。
过去近20年里,他曾在Perten(现在的珀金埃尔默)在近红外仪器和在食品工业中应用。他35研究论文,在ResearchGate.com上列出10发布我们的专利。
关于PerkinElmer食品安全和质量
PerkinElmer食品安全和质量是致力于提供创新所需的分析工具,以确保高质量的全球供应,和纯粹的食品安全。
这些信息已经采购,审核并改编自PerkinElmer食品安全和质量提供的材料。亚博网站下载
在这个来源的更多信息,请访问PerkinElmer食品安全和质量。
免责声明:这里的观点的受访者的观点,不一定代表AZoM.com (T / A) AZoNetwork有限,这个网站的所有者和经营者。这个声明的一部分条款和条件本网站的使用。