Аналитические данные. Интерпретация и обработка

Подробнее
Текстовая версия:
1 АНАЛИТИЧЕСКИЕ ДАННЫЕ  ИНТЕРПРЕТАЦИЯ И ОБРАБОТКА ВВЕДЕНИЕ В этой главе представлена информация, касающаяся приемлемой практики анализа и корректной интерпретации данных, полученных при проведении химических и других испытаний. Описываются основные статистические подходы к оценке данных, и подробно обсуждается обработка резко отклоняющихся значений и сравнение аналитических методов. [ПРИМЕЧАНИЕ. Не следует делать вывод о том, что инструментарий анализа, приведенный в этой главе, представляет собой исчерпывающий список. По усмотрению производителя или других пользователей могут применяться и другие, в равной степени приемлемые, статистические методы]. Обеспечение качества лекарственных препаратов достигается комбинацией ряда этапов, включающих создание устойчивого состава, валидацию, испытания исходных материалов, производственные испытания и оценку готового препарата. Каждый из этих этапов зависит от надежных методов испытаний. В процессе разработки создаются и валидируются процедуры испытаний, гарантирующие, что свойства производимых препаратов точно определены. Испытание готового препарата дает дальнейшую гарантию того, что препараты обладают неизменными характеристиками безопасности, эффективности и соот-ветствуют спецификациям. Измерения по своей сути изменчивы. Вариабельность биологических испытаний давно признается Фармакопеей США (USP). Например, необходимость учитывать эту вариабельность в анализе данных биологических испытаний рассмотрена в общей главе «Анализ результатов биологических испытаний» 1034. Измерения, применяемые в химическом анализе лекарственных препаратов, также по природе своей изменчивы, хотя в меньшей степени, чем измерения, полученные в биологических испытаниях. Однако во многих случаях критерии приемлемости пропорционально строже и, таким образом, эту меньшую допустимую вариабельность нужно рассматривать при анализе данных, полученных с ис-пользованием аналитических процедур. Если вариабельность измерения не охарактеризована и не указана рядом с результатом измерения, тогда данные можно интерпретировать только в самом ограниченном смысле. Например, утверждение, что разница между средними значениями, полученными в двух лабораториях при испытании одного и того же комплекта образцов, равна 10 %, не очень информативно в отношении значимости подобного расхождения, если не известны данные внутрилабораторной вариабельности. Настоящая глава задает направление для научно обоснованной обработки и интерпретации данных. В ней описываются средства статистического анализа, которые могут быть полезны в интерпретации аналитических данных. Находят широкое применение многие элементы описательной статистики, такие как среднее значение и стандартное отклонение. Другие статистические процедуры, такие как исключение резко отклоняющихся значений (выбросов), которые могут выполняться с использованием нескольких различных научно обоснованных методов, также включены в главу вместе с примерами их использования. Рамки, внутри которых интерпретируют результаты фармакопейного испытания, четко очерчены в разделе 7 «Результаты испытаний» главы «Общие замечания и требования». В конце настоящей главы, в Приложении 7, приведены ссылки на литературу, которая может быть полезна в качестве источника дополнительной информации по средствам статистического анализа. Список не должен рассматриваться как рекомендация USP, он также не является исчерпывающим. Дополнительную информацию о многих методах, упоминаемых в настоящей главе, также можно найти в большинстве учебников по статистике. ОБЯЗАТЕЛЬНЫЕ ЛАБОРАТОРНЫЕ МЕТОДЫ И ПРИНЦИПЫ Правильное применение статистических принципов к лабораторным данным возможно при условии, что такие данные были собраны (т.е. зарегистрированы) прослеживаемым образом и не содержат систематических ошибок. Чтобы получить такие данные, рекомендуется использовать следующие методы. Правильная регистрация данных Лабораторные записи ведутся с достаточной степенью детализации, так, чтобы другие аналитики с аналогичной квалификацией могли восстановить экспериментальные условия и проанализировать полученные результаты. Как правило, при сборе данных следует регистрировать значения с бóльшим количеством знаков после запятой, чем требуется в спецификации, и округлять только после выполнения окончательных расчетов, как описано в «Общих замечаниях и требованиях». Отбор проб Эффективный отбор проб  важный этап в оценке качественной характеристики генеральной совокупности. Цель отбора проб  обеспечить репрезентативные данные (выборку) для оценки свойств генеральной совокупности. Способ получения такой выборки целиком зависит от вопроса, на который отвечают с помощью анализируемых данных. Считается, что использование случайного отбора проб  самый подходящий способ формирования выборки. Действительно, необходима случайная и независимая выборка, чтобы гарантировать, что полученные данные дают достоверную оценку свойств генеральной совокупности. Формирование неслучайной или «благоприятной» выборки чревато тем, что оценки будут необъективными. Самый простой способ формирования случайной выборки называется «простым случайным отбором проб»  это процесс, в котором каждая единица совокупности имеет равный шанс быть отобранной. Однако иногда этот метод формирования случайной выборки не является оптимальным, потому что он не может гарантировать равное отражение всех факторов (например, время, место, оборудование), которые могут влиять на ключевые характеристики генеральной совокупности. Например, если для производства всех единиц партии требуется 12 ч, и очень важно, чтобы выборка отражала полный производственный процесс, то случайный отбор образцов после окончания производства может быть неприемлемым, поскольку он не дает гарантии, что такая выборка будет содержать одинаковое количество единиц, изготовленных на каждом временном этапе 12-часового процесса. Вместо этого лучше использовать «систематическую случайную выборку», при которой образцы случайно отбирают из производственного процесса через систематически выбранные промежутки времени или из систематически выбранных мест (например, пробы отбираются каждые 30 минут из числа образцов, произведенных за это время), чтобы гарантировать, что в выборку включены образцы, произведенные в течение всего производственного процесса. Другой тип процедуры случайного отбора необходим, если, например, продукт разливают во флаконы с использованием четырех разливочных машин. В этом случае важно сформировать случайную выборку флаконов, заполненных каждой машиной. «Стратифицированная случайная выборка», при которой отбирают равное количество флаконов, заполненных каждой из четырех разливочных машин, могла бы удовлетворить этому требованию. Независимо от цели отбора проб (например, испытания при выпуске серии), нужно определить план отбора проб для описания процесса получения выборки, чтобы гарантировать, что выборка является репрезентативной частью генеральной совокупности, и что полученные в результате данные достаточно достоверные. Оптимальная стратегия отбора проб будет зависеть от знания процессов производства и аналитических измерений. После определения схемы отбора проб можно рассчитывать, что процесс отбора будет включать элемент случайного выбора. В конечном счете, необходимо отобрать достаточно образцов для проведения первичного анализа, последующих контрольных анализов и других видов анализа. Рекомендуется проконсультироваться со специалистом по статистике для выбора оптимальной стратегии отбора проб. Испытания, обсуждаемые в оставшейся части главы, предполагают использование простого случайного отбора проб. Использование стандартных образцов В тех случаях, когда USP или NF предусматривают использование стандартного образца USP, соответствие испытуемого образца стандартам USP или NF подтверждается только теми результатами испытаний, которые были получены с использованием определенного указанного стандартного образца. Несмотря на то, что стандартные образцы USP могут использоваться на любом этапе жизненного цикла препарата в течение всего срока годности, USP не оговаривает время или частоту проведения испытаний. Поэтому пользователи USP и NF применяют ряд стратегий и процедур для обеспечения соответствия препарата фармакопейным требованиям, включая соответствие на момент проведения испытаний или в случае проведения испытаний. Подобные стратегии и процедуры могут включать использование вторичных стандартов, прослеживаемых к стандартам USP, для подтверждения или дополнения результатов испытаний, предпринятых с целью доказательства соответствия применимым фармакопейным стандартам. Поскольку присвоение значения стандарту – это один из наиболее важных факторов, влияющих на точность анализа, необходимо ответственно отнестись к утверждению и использованию 3 вторичных стандартов. Проверка эффективности системы Проверка приемлемого уровня эффективности аналитической системы при рутинном или постоянном использовании может быть очень полезна. Ее можно проводить, анализируя контрольные образцы через определенные интервалы времени или применяя другие способы, такие, как анализ отклонения стандартов, отношения фоновый сигнал/шум и др. Внимательное рассмотрение измеряемого параметра, например, составление графиков результатов, полученных посредством анализа контрольных образцов, может выявить изменения эффективности, которые требуют регулировки аналитической системы. Валидация метода Все аналитические методики соответствующим образом валидируют, как указано в главе «Валидация фармакопейных методов» 1225. Методики, опубликованные в USP и NF, были валидированы и удовлетворяют требованиям Современной Надлежащей Производственной Практики к валидации, установленным Сводом нормативных актов федеральных органов исполнительной власти США. Валидированная методика может использоваться для испытания нового состава (например, нового препа-рата, новой лекарственной формы или промежуточного продукта) только после подтверждения, что новый состав не влияет на точность, линейность или прецизионность метода. Не следует считать, что валидированная методика может правильно измерить содержание активного ингредиента в составе, который отличается от состава, использованного при установлении исходной достоверности методики. ПРИМЕЧАНИЕ ПО ТЕРМИНОЛОГИИ. Термин «точность» в главе 1225 и руководстве ICH Q2 означает исключительно отсутствие систематической ошибки. В международном словаре по метрологии (VIM) и документах Международной организации по стандартизации (ISO), «точность» имеет другое значение. В ISO «точность» объединяет понятия отсутствия систематической ошибки (правильности) и прецизионности. В данной главе термин употребляется в значении, приведенном в главе 1225, которое соответствует только понятию «правильности». ПРИНЦИПЫ ИЗМЕРЕНИЯ И ВАРИАЦИЯ Все измерения, в лучшем случае, представляют собой оценку фактического («истинного» или «принятого») значения ввиду свойственной им случайной вариабельности (также называемой случайной ошибкой) и могут также содержать систематическую вариацию (систематическую ошибку). Таким образом, измеренная величина отличается от фактического значения, так как вариабельность является неотъемлемой частью измерения. Если массив измерений состоит из отдельных результатов, которые представляют целое, то для оценки информативных свойств целого можно использовать статистические методы, а статистические критерии используют для изучения вероятности соответствия этих свойств утвержденным требованиям. Полученные в результате статистические оценки должны учитывать вариабельность, связанную с процессом измерения, а также вариабельность измеряемого объекта. Статистические показатели, используемые для оценки направления и величины этих ошибок, включают среднее значение, стандартное отклонение и их производные, такие, как коэффициент вариации в процентах (%CV, так же называемый относительным стандартным отклонением в процентах, %RSD). Установленную вариабельность можно использовать для расчета доверительных интервалов для среднего значения или характеристик вариабельности и толерантных интервалов для определенной части отдельных измерений. Использование статистических оценок должно быть обоснованно, особенно в отношении репрезентативной выборки. Данные должны согласовываться со статистическими допущениями, используемыми в анализе. Если одно или несколько из этих допущений нарушаются, для оценки данных могут потребоваться альтернативные методы. В частности, большинство статистических показателей и критериев, упомянутых в данной статье, основаны на допущении, что распределение всей совокупности данных является нормальным распределением, и что анализируемая выборка является репрезентативным подмножеством этой совокупности. Нормальное распределение (или распределение Гаусса)  колоколообразное и симметричное относительно своего центра и имеет определенные характеристики, требуемые для достоверности результатов испытаний. Однако данные не всегда укладываются в нормальное распределение, и тогда могут понадобиться трансформации для подгонки данных к нормальному распределению. Например, существуют переменные, у которых хвостовая часть распределения длиннее справа, чем слева. Такие распределения часто можно приблизить к нормальному после логарифмической трансформации. Альтернативным подходом является использование «свободных от распределения» или «непараметрических» статистических процедур, которые не требуют, чтобы форма совокупности соответствовала нормальному распределению. В тех случаях, когда цель, например, заклю-чается в построении доверительного интервала для среднего значения или разности двух средних, допущение о нормальности не так важно, что сформулировано в центральной предельной теореме. Тем не менее, необходимо проверить нормальность данных для построения достоверных доверительных интервалов для стандартных отклонений и коэффициентов стандартных отклонений, провести несколько испытаний на резко отклоняющиеся значения и построить достоверные статистические толерантные пределы. В последнем случае нормальность распределения является обязательным условием. В исследовании этого допущения могут пригодиться простые графические методы, такие, как точечные графики, гистограммы и графики нормальной вероятности. Единичное аналитическое измерение может оказаться полезным в оценке качества, если образец взят из целой совокупности, которая подготовлена с использованием хорошо валидированного, документированного процесса, и аналитические ошибки хорошо известны. Полученный аналитический результат можно квалифицировать за счет включения оценки сопутствующих ошибок. Иногда бывает полезно перейти к средним значениям, поскольку вариабельность, связанная со средней величиной, всегда меньше вариабельности отдельных измерений. Выбор в пользу отдельных измерений или же средних значений будет зависеть от области применения измерения и его вариабельности. Например, когда получают многочисленные измерения для одной и той же аликвоты образца, например, для многократных введений образца в ВЭЖХ, обычно, по указанной выше причине, целесообразно усреднить полученные результаты. Вариабельность может быть связана с дисперсией наблюдений вокруг центра распределения. Чаще всего в качестве меры центра распределения используют выборочное среднее значение (х): Вариабельность методики можно оценить различными способами. Наиболее часто используемая и полезная оценка вариабельности методики заключается в определении стандартного отклонения, основанного на повторных независимых1 измерениях характеристик образца. Стандартное отклонение для образца, s, рассчитывается по формуле: где хi – отдельное измерение в ряду n измерений, а х - среднее значение всех измерений. Затем рассчитывается относительное стандартное отклонение (%RSD) по формуле: и выражается в процентах. Если для достижения нормальности данные требуют логарифмического преобразования (например, для биологических испытаний), то доступны альтернативные методы.2 1 Многократные измерения (или, что то же самое, экспериментальные ошибки, связанные с многократными измерениями) независимы, если может быть сделано допущение о том, что они представляют случайный образец генеральной совокупности. В таком образце величина одного измерения не зависит от величины любого другого измерения и не оказывает на нее влияния. Отсутствие независимости подразумевает, что измерения коррелируют во времени или пространстве. Рассмотрим пример 96-луночного планшета микротитратора. Предположим, что всякий раз, когда неизвестные причины вызывают экспе-риментальную ошибку, приводящую к низкому результату (отрицательную ошибку), при помещении образца в первый ряд, те же самые причины приводят к низкому результату для образца, помещаемого во второй ряд, в этом случае два получающихся в результате измерения не будут статистически независимыми. Чтобы избежать этого, можно расположить образцы на планшете в случайном порядке. 2 Если для достижения нормальности распределения данные были логарифмически преобразованы (по основанию е), то %RSD 5 Для обеспечения лучшей оценки вариабельности методики нужно провести исследование прецизионности. Исследование прецизионности можно спланировать для определения промежуточной прецизионности (которая включает компоненты вариабельности «внутри» серии измерений и «между» сериями) и воспроизводимости (вариабельности «внутри» серии). При проведении исследований промежуточной прецизионности нужно учитывать поддающиеся прогнозированию изменения в условиях проведения эксперимента, такие, как выполнение испытания разными аналитиками, использование различных препаратов реактивов, выполнение испытания в разные дни и использование разного оборудования. Для выполнения исследования прецизионности измерение выполняют несколько раз. Каждая серия измерений должна быть полностью независима от других, чтобы обеспечить точные оценки различных компонентов вариабельности. Кроме того, в пределах каждой из серий проводятся повторные измерения, чтобы оценить воспроизводимость. См. пример исследования прецизионности в Приложении 2. При интерпретации данных можно рассмотреть доверительный интервал для среднего значения. Такие интервалы рассчитывают по нескольким результатам, используя среднее значение (х) и стандартное отклонение (отклонения) по формуле: где t/2, n – 1 – статистический показатель, зависящий от размера выборки (n), числа степеней свободы (n  1) и желаемого уровня доверительной вероятности (1  ). Значения этого показателя получают из таблиц t-распределения Стьюдента. Доверительный интервал дает оценку пределов, в которые попадает «истинное» среднее (μ), и также оценивает достоверность среднего значения выборки в качестве оценки истинного среднего значения. Если бы один и тот же эксперимент многократно повторяли при одних и тех же условиях, и каждый раз получали 95% (например) доверительный интервал, тогда следовало бы ожи-дать, что 95% таких интервалов содержат истинное среднее значение  μ. Нельзя с уверенностью утверждать, содержит ли доверительный интервал, рассчитанный по определенному набору фактических данных, величину μ. Однако, если предположить, что данные представляют собой независимые друг от друга измерения, полученные методом случайного выбора из совокупности с нормальным распределением, методика, используемая для построения доверительного интервала, гарантирует, что 95% таких доверительных интервалов содержат μ. Заметим, что важно надлежащим образом, с учетом всех соответствующих источников вариации, определить совокупность. ПРИМЕЧАНИЕ ПО ТЕРМИНОЛОГИИ. В документах Международной организации по стандартизации (ISO) используется другая терминология для некоторых понятий, описываемых в настоящей главе. Термин s/n, который, как правило, называется стандартной ошибкой среднего значения, в документах ISO носит название стандартной неопределенности. Термин t/2, n – 1 S/n называется расширенной неопределенностью, а t/2, n – 1 – коэффициентом охвата. Если стандартное отклонение получают, комбинируя оценки вариабельности, связанной с различными источниками, оно называется суммарной стандартной неопределенностью. Для некоторых из этих источников могут использоваться нестатистические оценки неопределенности, называемые неопределенностями типа В, например, неопределенность калибровки весов. РЕЗКО ОТКЛОНЯЮЩИЕСЯ РЕЗУЛЬТАТЫ Время от времени, наблюдаемые результаты анализов сильно отличаются от ожидаемых. Ошибочные, аномальные, непригодные, несогласованные, фальсифицированные, подозрительные или неправдоподобные наблюдения, а также резко отличающиеся, нестандартные и нехарактерные для совокупности значения обычно называют «резко отклоняющимися результатами». Как и в случае со всеми остальными получаемыми в лаборатории результатами, эти отклоняющиеся значения необходимо равняется: Это может в разумных пределах быть аппроксимировано выражением: где s  стандартное отклонение логарифмически преобразованных (по основанию е) данных.