Обратим внимание на следующее. Рекомендации РМГ 76 разработаны с учётом и в развитие требований международных стандартов серии ГОСТ Р ИСО 5725 (далее 5725), в первую очередь 6-й её части , касающейся ВЛК. Так вот, из двух интересующих нас видов контроля в последнем документе присутствует только проверка приемлемости. Оперативный контроль здесь не регламентируется. И в этом, думается, одна из причин упомянутого выше «смешивания»: при изучении оперативного контроля по РМГ 76, где, как заявлено, развиваются положения 5725, хочется найти в «родительском» документе первоисточник, и в качестве такового может «подвернуться» очень похожая проверка приемлемости.

Терминология, связанная с качеством и статистикой. Нестатистическая интерпретация этих значений заключается в том, что это максимальная разница между двумя результатами, полученными в определенных условиях, которые могут быть отнесены к точности метода тестирования. Следовательно, опубликованные пределы повторяемости и воспроизводимости могут использоваться в качестве пределов решения для поддержки или оспаривания обоснованности предположения о том, что оба результата испытаний были получены на одном и том же материале в правильном порядке в соответствии с конкретными условиями.

Что касается наследования, то здесь нужно сказать, что организацией ФГУП «УНИИМ» разработана и выпущена инструкция МИ 2881-2004 (далее МИ 2881), играющая для проверки приемлемости ту же роль, что и РМГ 76 для ВЛК, а также РМГ 64-2003 для оценивания показателей точности . Наглядно это наследование изображено на схеме . Заметим, что помимо алгоритмов и методов, наследуемых из 5725, разработанные РМГ/МИ содержат свои собственные, и весьма значительные, добавления.

Пределы повторяемости и воспроизводимости производятся статистически из специально разработанных исследований. Различные стандартные практики, предписывающие конкретные требования, связанные с этими исследованиями, были разработаны и приняты различными отраслями для удовлетворения их конкретных потребностей.

Хотя статистические подходы и философии могут отличаться от практических, все эти методы основаны на аналогичных статистических принципах, а интерпретация и применение полученных конечных результатов по существу одинаковы. Необходимо принять решение о том, может ли разница между этими двумя результатами быть связана исключительно с точностью тестирования метода.

В контексте настоящей статьи необходимо также учитывать некоторые положения и алгоритмы, содержащиеся в нормативных документах (НД) на методики выполнения измерений (МВИ). Дело в том, что в этих документах, как отечественных, так и зарубежных, в той или иной степени также регламентируется контроль погрешностей. Большинство документов по МВИ создавались либо до внедрения документов , либо без их учёта. Из-за этого возникают определённые методические трудности для согласованного их использования совместно с регламентированными в новых документах методами ВЛК . Об этом речь будет идти далее.

Где = среднее из двух результатов. Решение должно быть принято с использованием двух результатов в отношении наличия признаков деградации октана из-за транзита. Поскольку оба результата получены в условиях воспроизводимости, а абсолютная разница в 7 меньше, чем опубликованная воспроизводимость 9, разница может быть обусловлена исключительно точностью тестирования метода. Следовательно, нет убедительных доказательств того, что при транзите происходит октановая деградация.

Общее выражение для суммарной стандартной неопределенности

Как описано в предыдущей статье этой серии, за несколько коротких промежутков времени в течение нескольких часов повторяется один и тот же оператор и оборудование, что дает наилучшую ситуацию, которая должна быть наименьшей вариацией среди показаний. Это становится мерой повторяемости измерений и представляется путем вычисления стандартного отклонения повторяемости.

Показатели качества

При проведении любых видов ВЛК основным критерием для принятия решений является сравнение получаемых при измерениях значений с контрольными пределами. Эти пределы вычисляются на базе показателей качества методик анализа или показателей качества результатов анализа . Терминология и методология их установления и использования имеет ряд особенностей. Рассмотрение их важно для дальнейшего изложения.

Обычно требуется только небольшое количество повторов для каждого протокола испытаний в каждой лаборатории. Посредством усреднения результатов по многим лабораториям мы узнаем, как может работать типичная лаборатория. Конечно, все это зависит от того, сколько лабораторий участвовало и насколько хорошо они представляют реальный мир лабораторий. Таким образом, если у вас есть только 10 лабораторий, особенно если они разрабатывают стандарт, может быть сомнительно предположить, что любая другая случайная лаборатория также будет работать.

Это, безусловно, может иметь место для новых методов. Когда мы проводим метод испытаний во многих разных лабораториях на одном материале, мы надеемся обнаружить все потенциальные изменения, которые могут возникнуть при использовании метода испытаний. Поскольку у нас сейчас есть разные операторы, различное оборудование и различные условия окружающей среды, все промежуточные условия и многое другое будут введены. Таким образом, мы должны ожидать большей изменчивости результатов различных лабораторий.

Анализ терминологии

Относящиеся к ВЛК термины и определения встречаются во многих НД. Между ними не всегда имеется строгая синхронизация. А для однозначной трактовки используемых формулировок зачастую требуется дополнительный анализ. Ниже рассматриваются некоторые проблемные понятия, важные для оперативного контроля.

Мера этого большего изменения из-за показаний, взятых среди лабораторий, определяется как стандартное отклонение воспроизводимости. Опять же, проблема интерпретации этого варианта заключается в том, что он зависит от количества лабораторий. Когда используется только очень маленькая выборка из всех лабораторий, которые могут запускать этот метод, вы должны быть осторожны, полагая, что эти результаты типичны для всех лабораторий, которые могли быть сделаны с одним и тем же тестом. Кроме того, важно также взглянуть на результаты, чтобы убедиться, что некоторые лаборатории последовательно выполняют разные задачи.

Измеряемые значения

Без ограничения общности можно считать, что конечным итогом проведения любого КХА – другими словами измерения по МВИ – является некоторое числовое значение, выдаваемое в качестве результата для использования его в тех или иных целях. В 5725 такое значение называется результатом измерений , в РМГ 76 – результатом контрольного измерения , в МИ 2881 и РМГ 76 – результатом анализа . В других НД, в частности на методики измерений, могут встречаться и отличные названия, например окончательный результат . Мы будем придерживать термина результат измерения .

Часто основная причина различий между лабораториями является следствием некоторого типа предвзятости или систематической разницы, которая возникает для одной или нескольких лабораторий. Это особенно проблема, когда вы узнаете, когда на самом деле участвовало только очень небольшое количество лабораторий.

Процесс отбора выборки

Если мы используем термины повторяемости и воспроизводимости, описывающие характер вариации, то это изменение лучше всего рассчитывать как стандартное отклонение. При этих вычислениях мы приходим к интервалу воспроизводимости, который затем используется для сравнения разницы между двумя фактическими результатами испытаний, которые мы могли бы наблюдать из двух лабораторий. Эти типы интервалов предполагают следующее.

Другими важными для нас «объектами», фигурирующими в КХА, являются значения, полученные в результате двух или более повторений всех шагов измерения и используемые для усреднения с целью получения результата измерения (иногда вместо усреднения вычисляется медианы – см. далее). В 5725 это – единичные наблюдения , в РМГ 76 – результаты контрольных определений , в МИ 2881 и РМГ 76 – результаты единичных анализов (единичных определений) . Иногда также применяется термин параллельные определения , где слово «параллельные» означает получение всех значений в условиях повторяемости (см. далее). Мы будем придерживаться сочетания результат(ы) параллельного(ых) определения(ий) , поскольку условия повторяемости в рассматриваемых далее алгоритмах должны соблюдаться всегда.

Еще более важно повторное использование сравнения образцов. Например, если вы делаете много парных сравнений, вероятность того, что один будет случайным образом отличаться, быстро возрастает. В таблице приведены основные сводные статистические данные.

Представление информации о неопределенности

Чтобы интерпретировать эти значения стандартного отклонения, если бы мы имели показатель около 135, и у нас был один оператор в одной лаборатории, на котором было проведено много испытаний на этом материале, тогда 95 процентов показаний находились в диапазоне приблизительно 0 единиц. Но если только два чтения были запущены наугад, то в 95% случаев разница между этими двумя показаниями не должна превышать 33 единицы. Аналогичным образом, если в нескольких лабораториях прошел один тест, 95 процентов отдельных показаний упали бы в диапазоне около 6 единиц, но пара показаний редко имела бы разницу более чем на 02 единицы.

Особенности показателя повторяемости

На практике при трактовке параметров погрешностей, приводимых в различных НД, возникают определённые трудности. Не в последнюю очередь это связано с неоднозначностью трактовки, в том или ином контексте, некоторых терминов, что было проиллюстрировано выше. Есть и другие причины.

Стандарты 5725 «пришли к нам» из-за рубежа и, вообще говоря, без адаптации (это аутентичный перевод). Применять же их нужно, в первую очередь, к отечественным МВИ. Но в практике составления зарубежных и отечественных НД на методики сложились различия.

Конкурирующие интересы: авторы заявили, что конкурирующих интересов не существует. Использование стандартизированных инструментов является важным компонентом практики, основанной на фактических данных. Уверенность в стандартизированных инструментах требует от клиницистов понимания их свойств, сильных и слабых сторон, чтобы интерпретировать результаты и принимать клинические решения. В этой статье для врачей предлагается рассмотреть показатели ошибок измерения. Авторы представляют статистические методы, которые являются частью текущего подхода для оценки надежности тестирования и оценки результатов тестирования.

Зарубежные НД практически никогда не регламентируют усреднение для получения результата измерений, поэтому та или иная форма термина «параллельные определения» в них отсутствует. (По крайней мере это подтверждается нашим анализом нескольких десятков американских и международных стандартов – ASTM и ISO соответственно, – используемых на предприятиях нефтепереработки.) Как итог, документы 5725 оперируют только результатами измерений и никогда – результатами параллельных определений (в том смысле, как это понимается в рассматриваемых здесь РМГ/МИ). Это в полной мере относится и к определению повторяемости , которая в 5725-6 (см. п.п. 3.12–14) определяется как степень близости независимых результатов измерений в условиях повторяемости. А это, в свою очередь, означает, что для того, чтобы реализовать какую-либо разновидность контроля повторяемости, необходимо дважды полностью (от начала до конца) выполнить МВИ .

Надежность и надежность тестирования

Надежность относится к воспроизводимости измерений. Достоверность или воспроизводимость теста-повторного тестирования - это метод оценки надежности инструмента, путем его администрирования одному и тому же человеку или группе людей, таким же образом, в двух или более разных случаях, часов или дней друг от друга. Надежность тестирования-проверки обеспечивает клиницистам уверенность в том, что инструмент измеряет результат таким же образом, в стабильном клиенте, каждый раз, когда он используется. Лучшая воспроизводимость предполагает лучшую точность отдельных измерений, что является требованием для лучшего отслеживания изменений в измерениях в исследованиях или на практике.

Примечание. Именно из-за этого для повторяемости в 5725 количество параллельных измерений (не определений!) всегда равно 2.

Совсем иная картина наблюдается в отечественных НД на методики. Здесь практически всегда (если специфика МВИ это допускает) на последнем этапе для получения результата измерения регламентируется усреднение по двум или более результатам параллельных определений. Из статистики нетрудно понять, что разброс усреднённых результатов измерений , выполненных в условиях повторяемости, будет пропорционален разбросу используемых для усреднения результатов , в нашем случае параллельных определений (коэффициент пропорциональности равен, где n – количество этих определений). В связи с этим возникает естественное желание не делать для контроля повторяемости повторное измерение, как это регламентировано в 5725, а «удовлетвориться» уже полученными в первом измерении результатами параллельных определений. Что, собственно, и регламентируется в РМГ/МИ.

Есть два необходимых предположения в надежности тестирования-повторного тестирования. Во-первых, истинный балл не меняется между администрациями. Во-вторых, период времени между администрированием достаточно велик, чтобы предотвратить обучение, переносить эффекты или напомнить.

Изменение типа объекта испытаний

Понимание стабильности или изменчивости измеряемого результата и характеристики участников, участвующих в исследовании надежности, должны определять временной интервал между администрациями. Отличные оценки надежности тестов-реестров редки, так как все инструменты реагируют с некоторой ошибкой. Поскольку невозможно знать Т; истинная надежность любого теста не является расчетной. Надежность может быть определена с использованием статистической концепции дисперсии. Если компонент ошибки велико, то отношение близко к нулю, но оно близко к единице, если ошибка относительно мала.

Правильно это или нет, дело вкуса. Но одно несомненно: в 5725 и в наследуемых РМГ/МИ повторяемость определяется по-разному . В первом случае это близость результатов измерений , во втором – близость результатов параллельных определений . Это может приводить к затруднениям при изучении и сравнении относящихся к ВЛК документов. К примеру, такая цитата из 5725 (стр. V): «экстремальные показатели прецизионности – (это) повторяемость, сходимость и воспроизводимость» – однозначно говорит, что повторяемость и воспроизводимость трактуются здесь как предельные значения чего-то одного (прецизионности). Но в РМГ это разные понятия: повторяемость относится к результатам параллельных определений, воспроизводимость – к результатам измерений.

Количественная проверка надежности тестирования

Теоретически, тот же Т был бы получен, если бы клиент оценивался бесконечно много раз. Достоверность тестирования и повторного тестирования связана с повторяемостью наблюдений, сделанных индивидуумами или отдельными лицами. Когда стандартизованный инструмент используется для измерения результата, клиницисты полагаются на опубликованный критерий надежности теста-повторения инструмента, чтобы обеспечить уверенность в их результатах. Достоверность теста-повторения может быть оценена с использованием относительных и абсолютных показателей.

Примечание. Осознание этого факта поможет преодолеть интуитивное предубеждение, что повторяемость всегда больше воспроизводимости. Если факторы, влияющие на разброс результатов измерений за счёт смены испытателей, оборудования, времени суток и т.д., незначительны (например в опытах в пределах лаборатории), то влияние вполне может оказаться преобладающим, и повторяемость превысит воспроизводимость.

Оценки относительной достоверности касаются согласованности или ассоциации позиции лиц в группе по сравнению с другими. Эти корреляции количественно определяют направление и силу взаимосвязи между оценками тест-ретеста, оценивая их линейную зависимость и лежат между 1 и -1. Коэффициент корреляции является отражением того, насколько близко набор парных наблюдений следует прямой, независимо от наклона линии. Например, на рисунке 1 показаны два вымышленных набора данных, которые имеют сходную линейную зависимость.

Линия наилучшего соответствия - сплошная линия на графике и одинакова для обоих наборов данных, но черные круги намного ближе к линии, чем красные круги, что приводит к значительно более высокому коэффициенту корреляции. Ни наборы кругов не находятся на линии полного согласия. Основным недостатком ценности Пирсона является то, что он не предоставляет клиницистам никакого понимания систематических ошибок, которые могут быть связаны с измерением, полученным с помощью специального инструмента оценки.

Вышеизложенное важно для практической интерпретации характеристик погрешностей, приводимых в НД на МВИ, с целью их использования в ВЛК. Это рассматривается ниже.

Состав показателей качества

Как известно, ВЛК оперирует четырьмя показателями качества методики/результатов:

повторяемости, или сходимости (одно и то же для методики и результатов);

Например, как показано в гипотетических данных, приведенных на рисунке 1, Пирсон дает очень высокое значение 99 для черных кругов, несмотря на расхождение измерений по линии согласия. Клиницисты могут ошибаться в этой превосходной корреляции для полного согласия между баллами, что явно не так.

При чтении исследований надежности и перед выбором инструмента для использования важно, чтобы специалисты-практики критически оценивали характеристики участников исследования, участвующих в исследовании оценки надежности. Например, показатели когнитивной функции людей с прогрессирующей болезнью Альцгеймера будут более похожи друг на друга, чем у людей с различными неврологическими состояниями в разное время после диагноза. Таким образом, практикам необходимо тщательно убедиться, что инструмент, выбранный для использования, был протестирован в группе образцов с аналогичными характеристиками.

воспроизводимости (для методики) / внутрилабораторной (ВЛ) прецизионности (для результатов);

правильности (разные для методики и для результатов);

точности (разные для методики и для результатов).

Приведём некоторые особенности перечисленных показателей.

Стандарты 5725 оперирует только показателями качества методики.

Показатели правильности в оперативном контроле и проверке приемлемости не используются.

Показатели точности выражаются в виде доверительного интервала погрешности результатов анализа и обычно проблем с трактовкой не имеют. Обозначаются как Δ и Δ л для методики и результатов соответственно (здесь и далее индекс «л» означает «лабораторный»).

Показатель воспроизводимости. Как упоминалось выше, считается предельным случаем показателя прецизионности в условиях воспроизводимости, поэтому далее он и показатель ВЛ прецизионности будут называться просто показателями прецизионности. В математическом аппарате в РМГ/МИ в качестве основного для этих показателей используется представление в виде среднеквадратического отклонения (СКО), обозначаемого как σ R . и σ Rл. В то же время в НД на методики чаще используется предел прецизионности для двух результатов измерений. Наиболее распространённое обозначение R и R л.

Показатель повторяемости в РМГ/МИ также принято выражать в виде СКО, но теперь уже параллельных определений, и обозначать как σ r (считается, что σ rл = σ r как предельное значение «прецизионности параллельных определений» в условиях повторяемости). По аналогии с прецизионностью, в НД на методики чаще используется предел повторяемости r для n параллельных определений.

Трактовка погрешностей в НД на МВИ

Большинство отечественных НД создавались до появления (или без учёта) 5725 и наследуемых документов, так что формы представления в них погрешностей достаточно разнообразны и значительно отличаются от того, что «хотелось бы видеть». Мы не будем здесь касаться вопросов аналитического представления (проще говоря, формул) зависимостей показателей погрешностей от измеряемого значения (это будет рассмотрено в других публикациях), а обратимся к особенностям, связанным с возможным видом их представления: СКО или предел.

Итак, чтобы непосредственно (без преобразований формул) воспользоваться математикой ВЛК, необходимо выполнить два шага:

Шаг 1. Привести показатели повторяемости и прецизионности к СКО, если они заданы в виде пределов. Для воспроизводимости это означает выполнение преобразования σ R = R/Q(P, 2) º R/2,77, для повторяемости – σ r = r/Q(P, n). При этом, с учётом предыдущего раздела, нужно внимательно отслеживать, какая повторяемость представлена в НД. Например, в ASTM D 1319–03 регламентировано всё-таки, вопреки тому, что утверждалось выше по поводу зарубежных стандартов, усреднение по представительной выборке. Но так как стандарт зарубежный, то, как мы уже знаем, в нём повторяемость задаётся для двух результатов измерений. И верным будет соотношение σ r = r/Q(P, 2). Тем более что количество усредняемых значений n представительной выборки из данного документа не узнать.

Шаг 2. Установить каким-либо способом ВЛ показатели прецизионности и точности (для повторяемости, как мы знаем, в качестве внутрилабораторного используется показатель методики). В идеале это проведение специального эксперимента по оцениванию (приложение В в РМГ 76). Возможна также оценка по результатам контрольных карт (КК). Это всё – экспериментальные методы. В РМГ 76 регламентированы также (п.4.7) расчётные способы оценки. И хотя они рассматриваются там как временные: должны применяться лабораторией только на стадии внедрения МВИ, – на практике (например в стандартах предприятия или руководствах по качеству лабораторий) их довольно часто рассматривают как «окончательные». В этом есть определённый смысл. И вот почему.

У контроля качества результатов измерений есть две цели:

Отслеживать стабильность процессов производства, а значит и одной из важных его составляющих – процесса контроля качества материалов и продукции.

Гарантировать заявленную погрешность продукции, а значит и главный её критерий – погрешность методик испытаний.

Первая задача, вообще говоря, является внутренней для предприятия или лаборатории. «Философия» примерно такова: если производство налажено, желательно, чтобы оно было стабилизировано. А для этого желательно, чтобы был стабилизирован и процесс измерений. Поэтому изменения в погрешностях результатов измерений, даже если они не нарушают погрешностей, заявленных в НД на МВИ, являются нежелательными. То есть – эта задача требует установления ВЛ показателей качества результатов измерений и впоследствии их контроля.

Вторая задача ориентирована на заказчика, будь то внешнего или внутреннего. И, по большому счёту, его интересует гарантирование погрешности результатов измерений, заявленной в НД на МВИ. То есть – контролироваться должны показатели качества методик измерений.

Примечание. Иногда желательно уменьшить заявляемые погрешности измерений. Например в экологических испытаниях, где эти погрешности учитываются в нормативах контроля, превышение которых влечёт за собой штрафные санкции. В таких случаях, разумеется, также потребуются внутрилабораторные показатели.

Из сказанного следует, что существуют ситуации, когда целесообразно использовать для контроля исключительно показатели качества методик. То есть поступать так, как это непосредственно прописывается в НД на эти методики. В этом смысле использование расчётных показателей по РМГ 76 является неким компромиссным решением и вполне допустимо, если оно принято осознанно и зафиксировано в руководстве по контролю качества лаборатории. Правда, в этом случае может потребоваться некоторая коррекция расчётов, в том числе и при программировании приложений поддержки ВЛК.

В заключение раздела коснёмся небольшого вопроса, вызывающего иногда затруднения на практике. Речь идёт о выборе формул для оценки расчётных показателей. В РМГ 76 (п.7.4) приводится два набора:

первый набор характеризуется тем, что все показатели, кроме повторяемости, умножаются на 0,84. Должен применяться, когда для данной МВИ не планируется использование КК,

второй набор характеризуется тем, что показатель погрешности не остаётся без изменений, а показатель правильности пересчитывается (с новой прецизионностью). Должен применяться, когда КК для МВИ планируются.

Обоснование всему этому, видимо, таково. При ведении КК рано или поздно будут сделаны регламентируемые в РМГ оценки внутрилабораторных показателей, будет выполнено их протокольное оформление для последующего использования в ВЛК. Если же ведение КК не планируется, «приходится слегка подправить» показатель погрешности.

Примечание. Употреблённое выше «слегка подправить», умножив на 0,84 (или, что то же самое, разделив на 1,2), с точки зрения статистики означает сужение интервала погрешности до уровня доверительной вероятности 0,9.

Алгоритмы процедур контроля

Образцы (контролируемые или используемые для контроля)

Согласно РМГ 76, оперативный контроль проводится время от времени при наступлении определённых событий, таких как смена партии реактивов, использование средств измерений после ремонта, новая серия рабочих проб и т.п. В то же время согласно МИ 2881 (как и 5725-6) проверка приемлемости единичных результатов осуществляют при получении каждого результата анализа рабочих проб. иллюстрирует такое соотношение между рассматриваемыми образцами.

Примечание. Существует некая неоднозначность в том, как употреблять термины проба , образец , измерение и пр. В частности, когда в целях контроля выполняется сразу несколько измерений или назначается повторное измерение. Если измерения неразрушающие, уместно, видимо, говорить об измерениях . В противном случае более точным будет термин образец (повторный или аликвотный). Думается, эта неоднозначность не приведёт к недоразумениям при чтении статьи.

Рис. 2 «Встраивание» образцов оперативного контроля в последовательность рутинных испытаний, проводимых по конкретной МВИ

Проверка приемлемости

По некоторым соображение рассмотрение интересующих нас алгоритмов контроля удобно начать с проверки приемлемости результатов, хотя это и не основная тема статьи.

Проверку приемлемости применяют к результатам, получаемым в условиях повторяемости или воспроизводимости. Последняя ситуация рассматриваться не будет, так как проверка приемлемости в этом случае относится в основном к взаимоотношениям между лабораториями, например между поставщиком и потребителем, что «далеко» от оперативного контроля.

Примечание. Напомним, что условиями повторяемости называются такие условия, когда измерения выполняются «по одной и той же методике на идентичных пробах в одинаковых условиях (один и тот же оператор, одна и та же установка и т.п.) и практически в одно и то же время (то есть подряд)». Условиями же воспроизводимости называются условия, когда имеется одна и та же методика и используются идентичные пробы, а всё остальное меняется. Чаще всего речь идёт об измерениях в различных лабораториях.

Согласно МИ 2881 проверка приемлемости в условиях повторяемости (далее в тексте условия уточняться не будут) применяется к результатам параллельных определений отдельных результатов. Проверка применяется к рутинным пробам (на – верхний ряд), причём ко всем. И если это так, то говорят, что измерения выполняются с проверкой приемлемости.

В 5725 даётся несколько иное определение. Связано это с тем, что, как отмечалось выше, в зарубежных НД «нет» параллельных определений. Поэтому в ситуациях с повышенными требованиями к результатам измерений процедура МВИ может выполняться два или более раз подряд и подвергаться контролю приемлемости для установления окончательного результата по этим измерениям. Такой алгоритм может быть прописан, например, в технических условиях (ТУ) на продукцию или в договоре. В отличие от отечественной практики, где выполнение «нескольких измерений подряд» называется параллельными определениями или чем-то подобным прописывается непосредственно в НД на МВИ.

Несмотря на расхождение в терминологии и некоторые нюансы, алгоритм проверки (), регламентированный в МИ 2881, фактически полностью совпадает с соответствующим алгоритмом 5725-6.

Примечание. В 5725-6 имеется также алгоритмы с получением другого количества дополнительных результатов. Принципиально они не отличаются от приведённого на .

Рис. 3 Алгоритм проверки приемлемости результатов измерений по 5725-6

Отметим следующие важные моменты:

Контролируется (проверяется) только повторяемость.

Результатом проверки приемлемости является установление результата измерения.

Количество единичных результатов измерений, по которому определяется результат измерения, зависит от хода проверки приемлемости.

Результат измерения может выражаться не только в виде среднего, но и в виде медианы.

Стоит сказать ещё вот о чём. В большинстве отечественных НД на МВИ регламентируется проверка приемлемости в виде простой проверки «в норме / не в норме». Фактически это означает, что в случае неудовлетворительной проверки результат попросту перемеряется.

Особая ситуация в зарубежных НД. Стандартная формулировка в них: «разница между двумя результатами может превышать контрольный предел только в одном случае из двадцати» (5% в соответствии с принятой в лабораторной практике доверительной вероятностью 0,95). Фактически здесь не идёт речь о повторных или дополнительных измерениях, а об отслеживании данных за некоторый промежуток времени. Последовательное применение этого положения приведёт к чему-то похожему на ведение КК.

Как в описанных случаях применить алгоритм , не нарушая НД? Ответ дан в МИ 2881: следует записать новый алгоритм в ТУ, руководство по качеству и т.п.

Последнее замечание. При реализации алгоритма затруднения может вызвать то обстоятельство, что ни в 5725, ни в МИ не регламентируется способ определения опорного значения, по которому вычисляется норматив контроля в случаях, когда показатель повторяемости зависит от измеряемой величины. Видимо, не остаётся ничего другого, как брать в качестве X оп текущее среднее значение, даже если затем в качестве окончательного результата будет использована медиана. Думается, это достаточно эффективно, поскольку вероятность такого события (необходимость медианы) крайне мала: при доверительной вероятности 0,95 два подряд нарушения повторяемости будут наступать в одном случае из 400 (0,25%).

Оперативный контроль

В отличие от проверки приемлемости, оперативный контроль проводится на специальных, дополнительных по отношению к рутинным, пробах (на Рис. 2 – нижний ряд). Даже если предположить, что в каких-то случаях только что испытанная рутинная проба тут же «включается» в оперативный контроль, скажем в методе добавок, всё равно это будет именно контрольное испытание, но с «некоторыми особенностями» получения первого измерения. К тому же такую практику нельзя признать целесообразной, так как в этом случае не так-то просто достигнуть точного соблюдения регламента оперативного контроля в соответствии с РМГ 76.

Алгоритмы оперативного контроля подразделяются на две категории:

Контроль повторяемости

Как отмечено выше, контроль повторяемости является вспомогательным: он должен, согласно п.5.10.2 в РМГ 76, применяться к результатам измерений, выполняемых внутри алгоритмов оперативного контроля погрешности (а также в не рассматриваемых здесь периодическом и выборочном статистическом контролях). Напомним, что контроль повторяемости выполняется только для МВИ, у которых для получения результата измерения предусмотрены параллельные определения.

Терминология и требования к точности методов и результатов измерений регламентированы в комплексе из шести государственных стандартов РФ — ГОСТ Р ИСО 5725 под общим заголовком «Точность (правильность и прецизионность) методов и результатов измерений» , введенных в действие в 2002 году (далее Стандарт 5725). Стандарты ГОСТ Р ИСО являются переводом с английского языка международных стандартов ИСО 5725:1994.

Слово «метод» в Стандарте 5725 охватывает и собственно метод измерений и методику их выполнения и должно трактоваться в том или ином смысле (или в обоих смыслах) в зависимости от контекста. Поскольку Стандарт 5725 указывает, каким образом можно обеспечить необходимую точность измерения, в принципе становится возможным сравнивать по точности различные методы измерений, методики их выполнения, организации (лаборатории) и персонал (операторов), осуществляющих измерения.

Появление Стандарта 5725 вызвано возрастанием роли рыночных стимулов к качественному выполнению измерений и является ответом на такие острые вопросы, как: что такое качество измерений и как его измерять; можно ли определить, насколько при измерении той или иной величины один метод (методика) совершеннее другого или одна испытательная организация лучше другой; в какой степени следует доверять измеренным и зафиксированным значениям; и т.п.

В отечественной метрологии погрешность результатов измерений, как правило, определяется сравнением результата измерений с истинным или действительным значением измеряемой величины.

Истинное значение - значение, которое идеальным образом характеризует в качественном и количественном отношении соответствующую величину.

Действительное значение - значение величины, полученное экспериментальным путем и настолько близкое к истинному значению, что в поставленной измерительной задаче может быть использовано вместо него.

В условиях отсутствия необходимых эталонов, обеспечивающих воспроизведение, хранение и передачу соответствующих значений величин, необходимых для определения погрешности (точности) результатов измерений, в отечественной и международной практике за действительное значение зачастую принимают общее среднее значение (математическое ожидание) заданной совокупности результатов измерений, выражаемое в отдельных случаях в условных единицах. Эта ситуация и отражена в термине «принятое опорное значение» и рекомендуется для использования в отечественной практике.

Понятие принятого опорного значения является более универсальным, чем понятие «действительное значение». Оно определяется не только как условно истинное значение измеряемой величины через теоретические константы и (или) эталоны, но и (в их отсутствии) как ее среднее значение по большому числу предварительно выполненных измерений в представительном множестве лабораторий. Таким образом, принятым опорным значением может быть как эталонное, так и среднее значение измеряемой характеристики.

Точность - степень близости результата измерений к принятому опорному значению.

В рамках обеспечения единства измерений вводится термин «правильность» - степень близости к принятому опорному значению среднего значения серии результатов измерений. Показателем правильности обычно является значение систематической погрешности .

Прежде термин «точность» распространялся лишь на одну составляющую, именуемую теперь правильностью. Однако стало очевидным, что он выражает суммарное отклонение результата от эталонного (опорного) значения, вызванное как случайными, так и систематическими причинами.

Прецизионность - степень близости друг к другу независимых результатов измерений, полученных в конкретных регламентированных условиях. Независимые результаты измерений (или испытаний) - результаты, полученные способом, на который не оказывает влияние никакой предшествующий результат, полученный при испытаниях того же самого или подобного объекта.

Необходимость рассмотрения «прецизионности» возникает из-за того, что измерения, выполняемые на предположительно идентичных материалах при предположительно идентичных обстоятельствах, не дают, как правило, идентичных результатов. Это объясняется неизбежными случайными погрешностями, присущими каждой измерительной процедуре, а факторы, оказывающие влияние на результат измерения, не поддаются полному контролю.

Прецизионность зависит только от случайных погрешностей и не имеет отношения к истинному или установленному значению измеряемой величины. Меру прецизионности обычно выражают в терминах неточности и вычисляют как стандартное отклонение результатов измерений. Меньшая прецизионность соответствует большему стандартному отклонению. Количественные значения мер прецизионности существенно зависят от регламентированных условий. Крайними случаями таких условий являются условия повторяемости и условия воспроизводимости.

Повторяемость - прецизионность в условиях повторяемости. В отечественных НД наряду с термином «повторяемость» используют термин «сходимость» .

Условия повторяемости (сходимости) - условия, при которых независимые результаты измерений (или испытаний) получаются одним и тем же методом на идентичных объектах испытаний, в одной и той же лаборатории, одним и тем же оператором, с использованием одного и того же оборудования, в пределах короткого промежутка времени. В качестве мер повторяемости (а также воспроизводимости) в Стандарте 5725 используются стандартные отклонения.

Стандартное (среднеквадратическое) отклонение повторяемости (сходимости) - это стандартное (среднеквадратическое) отклонение результатов измерений (или испытаний), полученных в условиях повторяемости (сходимости). Эта норма является мерой рассеяния результатов измерений в условиях повторяемости.

В Стандарте 5725 для крайних условий измерений введены показатели свойств повторяемости и воспроизводимости пределов.

Предел повторяемости (сходимости) - значение, которое с доверительной вероятностью 95% не превышается абсолютной величиной разности между результатами двух измерений (или испытаний), полученными в условиях повторяемости (сходимости).

Воспроизводимость - прецизионность в условиях воспроизводимости.

Условия воспроизводимости - это условия, при которых результаты измерений (или испытаний) получают одним и тем же методом, на идентичных объектах испытаний, в разных лабораториях, разными операторами, с использованием различного оборудования.

Стандартные (среднеквадратические) отклонения воспроизводимости - стандартные (среднеквадратические) отклонения результатов измерений (испытаний), полученных в условиях воспроизводимости. Эта норма является мерой рассеяния результатов измерений (или испытаний) в условиях воспроизводимости.

Предел воспроизводимости - значение, которое с доверительной вероятностью 95% не превышается абсолютной величиной разности между результатами измерений (или испытаний), полученными в условиях воспроизводимости.

Для практики измерений важен термин «выброс» . Выброс - элемент совокупности значений, который несовместим с остальными элементами данной совокупности.

В Стандарте 5725 установлены правила представления в стандартах на методы испытаний стандартных отклонений повторяемости и воспроизводимости, пределов повторяемости и воспроизводимости, систематической погрешности метода. Значение систематической погрешности всегда представляется вместе с описанием принятого опорного значения, относительно которого оно определялось. Значения стандартных отклонений повторяемости и воспроизводимости представляются с указанием условий эксперимента, в результате которого они были получены (число участвующих лабораторий, контролируемые значения измеряемой величины в диапазоне измерения метода, наличие выбросов в данных отдельных лабораторий).

В соответствии с утвержденным Порядком введения в действие описываемого ГОСТ Р его положения вводятся в действие при разработке новых и (или) пересмотре действующих методик выполнения измерений (МВИ) .

Создание системы контроля точности результатов измерений в соответствии со Стандартом 5725 и международными стандартами позволит нашей стране избежать убытков во внешней торговле.