Quantum K-nearest neighbor#

Автор(ы):

Токарев Игорь

Введение#

Если вы занимались машинным обучением, то, скорее всего, знакомы с классическим алгоритмом $k$ ближайших соседей. Он относительно прост, применяется как в задачах классификации, так и в регрессии. Кстати, классический knn можно вспомнить обратившись к лекции от ODS по классическому машинному обучению.

Давайте немножко вспомним задачу классификации с использованием классического $k N N$ алгоритма:

У нас есть $\vec{x} \in {0, 1}^{N}$ – тестовый образец, а также тренировочные образцы – это набор векторов $\vec{v_{i}} \in {0, 1}^{N}$ , в котором каждый вектор уже размечен. И наша задача подобрать правильную метку тестовому образцу.

Тогда мы пройдём следующие шаги:

Вычислим похожесть между тестовым образцом и каждым тренировочным образцом.
Найдем $k$ ближайших к тестовому образцу соседей.
Подсчитаем количество представителей для каждого класса и приписываем метку самого часто встречающегося класса к тестовому образцу.

Самой трудозатратным шагом является вычисление расстояния от тестового образца к каждому тренировочному. Также и в квантовой версии алгоритма.

Note

На текущий момент разработано несколько разных версий квантового алгоритма поиска ближайших соседей. Есть версия основанная расстоянии Хэмминга [LTG21]:

Расстояние Хэмминга между векторами $\vec{x}$ и $\vec{v_{i}}$ :

d_{i} = | \vec{x} - \vec{v_{i}} | = \sum_{j = 1}^{N} (x_{j} \oplus v_{i j})

Но в данной работе мы обратим внимание на версию, которая вычисляет fidelity между двумя векторами состояниями.

Пусть задано Гильбертово пространство $n$ кубитов, размерности $N = 2^{n}$ . Вектор $| ψ ⟩ \in H$ – это тестовое состояние, для которого нам нужно определить метку.

Пусть ${| ϕ ⟩ : j \in {0, . . ., M - 1}} \subset H$ - это набор тренировочных состояний, для которых мы знаем их метки. $M = 2^{m}, m \in Z$

Определим fidelity между тестовым состоянием и $j$ -тым тренировочным $| ϕ_{j} ⟩$ как

F_{j} = F (ψ, ϕ_{j}) = | ⟨ ψ | ϕ_{j} ⟩ |^{2}

В свою очередь $F = [F_{0}, F_{1}, . . ., F_{M - 1}]$ - это таблица fidelity значений между тестовым состоянием и каждым из тренировочных.

Заметим, что задача нахождения $k$ ближайших соседей сводится к задаче нахождения $k$ максимумов значений fidelity из таблицы $F$ . Для этого мы должны реализовать оракула

O_{y, A} | j ⟩ | 0 ⟩ = | j ⟩ | f_{y, A} (j) ⟩,

где $f_{y, A}$ - это булева функция определённая как

\begin{array}{r} f_{y, A} (j) = {\begin{cases} 1 : F_{j} > F_{y} and j \notin A, \\ 0 : otherwise, \end{cases} \end{array}

Алгоритм#

Далее мы алгоритм представленный в работе [BAG21].

../../../_images/qknn.png — Fig. 67 Принципиальная схема QkNN алгоритма. Взято из работы [BAG21].#

Квантовый алгоритм поиска $k$ ближайших соседей будет состоять из двух основных шагов:

Используй оракул $O_{y, A}$ (для алгоритма Гровера) мы находим $k$ состояний ${| ϕ_{j 1} ⟩, . . ., | ϕ_{j k} ⟩}$ для которых значение fidelity с тестовым состоянием максимально.
Найти преобладающую метку среди $k$ найденных состояний и присвоить её тестовому состоянию.

Самой нетривиальной задачей для нас будет построение оракула $O_{y, A}$ .

Вначале нужно составить оператор $F$ , который выполняет преобразование вида:

$F | j ⟩ | 0 ⟩ = | j ⟩ | F_{j} ⟩$

для $j \in {0, . . ., M - 1}$ . $| F_{j} ⟩$ – это одно из базисных состояний вычислительного базиса (выражающее двоичное представление числа $F_{j}$ ).
- Выполняется преобразование: $ξ^{a m p} | j ⟩ | 0 ⟩ = | j ⟩ | ψ_{j} ⟩$ . В амплитуду состояния $| ψ_{j} ⟩$ закодирована информация о числе $F_{j}$ Делается это с помощью Swap test.
  
  Swap test это применение контролируемой операции $S w a p$ , которым можно пользоваться для того, чтобы статистически определять fidelity: $F (ψ, ϕ) = | ⟨ ψ | ϕ ⟩ |^{2}$ между двумя произвольными чистыми состояниями $| ψ ⟩$ и $| ϕ ⟩$ .
  
  $\begin{array}{r} C S W A P (| 0 ⟩ | ψ ⟩ | ϕ ⟩) = | 0 ⟩ | ψ ⟩ | ϕ ⟩ \\ C S W A P (| 1 ⟩ | ψ ⟩ | ϕ ⟩) = | 1 ⟩ | ψ ⟩ | ϕ ⟩ \end{array}$
  
  Fig. 68 Схема Swap test#
- Выполняется преобразование $ξ^{d i g} | j ⟩ | ψ_{j} ⟩ = | j ⟩ | F_{j} ⟩$
  
  И тогда $F = ξ^{d i g} ξ^{a m p}$ .
Берём 2 пары регистров $i_{1}, f_{1}; i_{2}, f_{2}$ . Инициализируются они в форме $| j ⟩_{i_{1}} | 0 ⟩_{f_{1}} | y ⟩_{i_{2}} | 0 ⟩_{f_{2}}$

Применяется $F$ на каждой паре:

$F (| j ⟩_{i_{1}} | 0 ⟩_{f_{1}}) F (| y ⟩_{i_{2}} | 0 ⟩_{f_{2}}) = | j ⟩_{i_{1}} | F_{j} ⟩_{f_{1}} | y ⟩_{i_{2}} | F_{y} ⟩_{f_{2}}$
Теперь информация закодирована в регистры и нам нужно реализовать функцию $f_{y, A}$ . И пусть $C$ это оператор, реализующий $f_{y, A}$ .

$C (| j ⟩_{i_{1}} | F_{j} ⟩_{f_{1}} | y ⟩_{i_{2}} | F_{y} ⟩_{f_{2}}) = | j ⟩_{i_{1}} | 0 ⟩_{f_{1}} | f_{y, A} ⟩_{i_{2}} | 0 ⟩_{f_{2}}$

Теперь займёмся вопросом конструирования оракула $O_{y, A}$ . Просьба держаться за ваши кресла.

Вначале мы подготовим состояния. Но чтобы это сделать нам нужны оракулы $V, W$ . Как их имплементировать указано в статье, которая указывалась выше.

V | 0^{n} ⟩ = | ψ ⟩

W | j ⟩ | 0^{n} ⟩ = | j ⟩ | ϕ ⟩

для всех $j \in {0, . . ., M - 1}$ .

Инициализируем 4 регистра $i$ , $t r$ , $t s t$ , $B$ с соответствующим количеством кубитов в каждом $m$ , $n$ , $n$ , $1$ , где $n = \log (N)$ , $m = \log (M)$ .

$| j ⟩_{i} | 0^{\otimes n} ⟩_{t r} | 0^{\otimes n} ⟩_{t s t} | 0 ⟩_{B}$
Применяем $W$

$W (| j ⟩_{i} | 0^{\otimes n} ⟩_{t r} | 0^{\otimes n} ⟩_{t s t} | 0 ⟩_{B}) = | j ⟩_{i} | ϕ_{j} ⟩_{t r} | 0^{\otimes n} ⟩_{t s t} | 0 ⟩_{B}$
Применяем $V$

$V (| j ⟩_{i} | ϕ_{j} ⟩_{t r} | 0^{\otimes n} ⟩_{t s t} | 0 ⟩_{B}) = | j ⟩_{i} | ϕ_{j} ⟩_{t r} | ψ_{j} ⟩_{t s t} | 0 ⟩_{B}$
Применяем swap test между тренировочным регистром $t r$ и тестовым регистром $t s t$ , а регистр $B$ будет выступать в качестве контрольного.

$\frac{1}{2} [(| ϕ_{j} ⟩ | ψ ⟩_{t s t} + | ψ_{j} ⟩ | ϕ ⟩_{t s t}) | 0 ⟩_{B} + (| ϕ_{j} ⟩ | ψ ⟩_{t s t} - | ψ_{j} ⟩ | ϕ ⟩_{t s t}) | 1 ⟩_{B}] = | j ⟩_{i} | ψ_{j} ⟩_{t r, t s t, B}$

Определим $U$ как унитарное преобразование, которое объединяет шаги 3-4. Кстати, если мы сейчас произведём измерение регистра $B$ , то будем иметь

$\begin{array}{r} P r (B = 0) = \frac{1 + F_{j}}{2} \\ P r (B = 1) = \frac{1 - F_{j}}{2} \end{array}$

На этом шаге информация о $f i d e l i t y$ теперь закодирована в амплитуды. Теперь же мы должны перевести $f i d e l i t y$ из амплитуды в число.
Теперь мы будем конструировать новый гейт G. Вообще говоря, он описан в работе [MKF19], где вы можете подробнее с ним ознакомиться.

$G = U_{t r, t s t, B} W_{i, t r} S_{0_{t r, t s t, B}} W_{i, t r}^{†} U_{t r, t s t, B}^{†} Z_{B},$

где $Z_{B}$ – это действие гейта $Z$ на регистре $B$ , $S_{0} = I - 2 | 0 ⟩ ⟨ 0 |$ .
Текущее состояние $| ψ ⟩_{t r, t s t, B}$ может быть представлено в виде композиции двух состояний

$| ψ_{j} ⟩ = \frac{- i}{\sqrt{2}} (e^{i π θ_{j}} | ψ_{j +} ⟩ - e^{- i π θ_{j}} | ψ_{j -} ⟩)$
Теперь применяем алгоритм QPE (Quantum Phase Estimation), чтобы перевести значение фазы $θ_{j}$ в числовое представление.

$Q P E (| ψ_{j} ⟩) = \frac{- i}{\sqrt{2}} | j ⟩_{i} [e^{i π θ_{j}} | θ_{j} ⟩_{p h} | ψ_{j +} ⟩_{t r, t s t, B} - e^{- i π θ_{j}} | 1 - θ_{j} ⟩_{p h} | ψ_{j -} ⟩_{t r, t s t, B}] = | j ⟩_{i} | ψ_{j, A E} ⟩_{p h, t r, t s t, B}$
Применяем алгоритм квантовой арифметики:

$| j ⟩ | F_{j} ⟩_{f i d} | ψ_{j, A E} ⟩_{p h, t r, t s t, B}$
Обнуляем регистры $p h, t r, t s t, B$ и получаем $| j ⟩_{i} | F_{j} ⟩_{f i d}$ На самом деле шаги 5-9 составляют оператор $ξ^{d i g}$ , который мы упоминали ранее.
Теперь применяем оператор $F$

$| j ⟩_{i 1} | F_{j} ⟩_{f 1} | y ⟩_{i 2} | F_{y} ⟩_{f 2}$
Добавим кубит $Q_{1}$ для выполнения сравнения

$\begin{array}{r} J | a ⟩ | b ⟩ | 0 ⟩ = {\begin{cases} | a ⟩ | b ⟩ | 1 ⟩ : a > b, \\ | a ⟩ | b ⟩ | 0 ⟩ : a \leq b, \end{cases} \end{array}$

$| j ⟩_{i 1} | F_{j} ⟩_{f 1} | y ⟩_{i 2} | F_{y} ⟩_{f 2} | g (j) ⟩_{Q_{1}},$

где

$\begin{array}{r} g (j) = {\begin{cases} 1 : F_{j} > F_{y}, \\ 0 : F_{j} \leq F_{y}, \end{cases} \end{array}$

По кубиту $Q_{1}$ мы сможем распознать все индексы $j$ для которых $F_{j} > F_{y}$ .
Обнуляем регистры $i 2$ , $f 2$ .
Добавляем ещё один кубит $Q_{2}$ для каждого $i_{l} \in A$ , применяя гейт $D^{(i_{l})}$

$\begin{array}{r} D^{(i_{l})} | j ⟩ | 0 ⟩ = {\begin{cases} | j ⟩ | 1 ⟩ : j = i_{l}, \\ | j ⟩ | 0 ⟩ : j \neq i_{l}, \end{cases} \end{array}$

на индексах регистра. И в результате получим состояние

$| j ⟩_{i 1} | F_{j} ⟩_{f 1} | g (j) ⟩_{Q_{1}} | χ_{A} (j) ⟩_{Q_{2}}$
О да… Теперь мы добавляем ещё один кубит $Q_{3}$ . Применяем гейт $X$ на кубите $Q_{2}$ и гейт Тоффоли с контролирующими $(Q_{1}, Q_{2})$ и целевой $Q_{3}$

$| j ⟩_{i 1} | F_{j} ⟩_{f 1} | g (j) ⟩_{Q_{1}} | χ_{A} (j) ⟩_{Q_{2}} | f_{y, A} (j) ⟩_{Q_{3}}$
Обнуляем все регистры, кроме $Q_{3}$

$| j ⟩_{i 1} | f_{y, A} (j) ⟩_{Q_{3}}$

Что ж, вот мы и построили преобразование $O_{y, A}$ которое так хотели

$O_{y, A} | j ⟩ | 0 ⟩ = | j ⟩ | f_{y, A} (j) ⟩$

QMLCourse

Quantum K-nearest neighbor

Contents

Quantum K-nearest neighbor#

Введение#

Алгоритм#