Сравнение квантовой и классической имитации отжига#

Автор(ы):

Описание лекции#

В этой лекции рассмотрим каноническую работу Quantum annealing in the transverse Ising model, опубликованную в 1998 году [KN98]. В ней двумя способами численно решается задача о нахождении основного состояния системы взаимодействующих спинов. Первый способ – обычная классическая имитация отжига, второй – имитация квантового отжига. Результаты применения этих подходов анализируются и сравниваются между собой.

Постановка задачи#

Итак, рассматривается одномерная система взаимодействующих спинов, которая описывается гамильтонианом Изинга (полностью аналогичным тому, который был представлен в базовой лекции о модели Изинга):

H^0=i,jJijσ^izσ^jzhiσ^iz,

где Jij – величины обменного взаимодействия для пар спинов, h – внешнее поле (оно направлено вдоль оси z и потому называется продольным – longitudinal). Требуется найти основное состояние гамильтониана H^0, т.е. его собственное состояние, соответствующее его минимальному собственному значению.

Далее разберем численное решение этой задачи с помощью обычной классической имитации отжига (simulated annealing, SA для краткости) и с помощью квантовой имитации отжига (quantum annealing – QA).

Имитация квантового отжига (QA)#

Как в предыдущей лекции об аннилере D-Wave, добавляем к “целевому” гамильтониану H^0 (problem Hamiltonian) слагаемое, которое называется tunneling Hamiltonian:

(62)#H^(t)=H^0Γ(t)iσ^ix=H^0+H^tun(t),

где H^tun(t) зависит от времени и отвечает за квантовомеханическое туннелирование между различными собственными состояниями гамильтониана H^0. Оператор H^tun(t) соответствует приложенному внешнему магнитному полю вдоль оси x (т.е. поперечному, transverse). Когда величина Γ(t) очень велика по сравнению с Jij и h, собственное состояние гамильтониана H^(t), соответствующее его минимальному собственному значению, представляет собой линейную комбинацию всевозможных состояний системы с приблизительно равными амплитудами вероятностей ориентации каждого спина вверх и вниз. Если достаточно медленно уменьшать Γ(t) с очень большой величины до нуля, можно надеяться (в соответствии с адиабатической теоремой), что приведем систему в основное состояние гамильтониана H^0.

В обсуждаемой статье в качестве примеров рассматриваются три различных закона изменения Γ(t):

  • Γ(t)=cln(t+1),

  • Γ(t)=ct,

  • Γ(t)=ct,

везде t(0,+) и c=const.

Квантовая динамика системы описывается нестационарным уравнением Шредингера

(63)#it|ψ(t)=H^(t)|ψ(t)

Это уравнение решается численно (с помощью дискретизации по времени и применения конечно-разностной схемы) для небольшой системы (число спинов N=8). Измерить близость состояния |ψ(t) к основному состоянию |g гамильтониана H^0 можно путем вычисления вероятности

PQA(t)=|g|ψ(t)|2

Note

Основное состояние |g для небольшого числа спинов можно найти точно, например, путем полного перебора.

Кроме того, можно рассмотреть так называемое квазистатическое приближение. Выберем какое-нибудь значение Γ=const и решим задачу об основном состоянии |ψΓ независящего от времени гамильтониана

H^0Γiσ^ix

Следует ожидать, что при очень медленном изменении Γ(t) вероятность

PQAst(Γ)=|g|ψΓ|2

будет близка к PQA(t) (имеется в виду, что значение Γ соответствует значению Γ(t)). Отличие PQA(t) от PQAst(Γ) говорит о том, насколько близко состояния системы при динамическом процессе отжига следуют за соответствующими “квазистатическими” состояниями.

Классическая имитация отжига (SA)#

В лекции, посвященной комбинаторной оптимизации, процесс имитации отжига описывался таким образом: выбиралось случайное начальное состояние, затем оно в цикле подвергалось случайной модификации, и новое состояние принималось или отклонялось в соответствии с некоторым критерием. В статье [KN98] принят другой подход к SA. Рассматривается так называемое основное кинетическое уравнение (англ. master equation). Оно описывает классический SA процесс, соответствующий нестационарному уравнению Шредингера (63). В нашем случае это система обыкновенных дифференциальных уравнений для вероятностей нахождения системы в различных состояниях i в момент времени t:

(64)#dPi(t)dt=jLijPj(t),

где Lij – вероятность перехода системы из состояния j в состояние i (при ji) в единицу времени. Рассматриваются только элементарные переходы, сопровождающиеся изменением ориентации какого-либо одного спина (остальные спины при данном переходе не меняют ориентацию). Элементы матрицы переходов записываются следующим образом:

(65)#Lij={11+exp(EiEjT(t))(single-spin transition,ji)kiLki(j=i)0(otherwise)

Для первого условия правая часть в формуле (65) соответствует распределению Больцмана. Для понимания полезно проанализировать несколько предельных случаев:

  • если Ei<Ej и |EiEj|T(t), то вероятность перехода ji близка к 1;

  • если Ei>Ej и EiEjT(t), то вероятность перехода ji близка к 0;

  • если |EiEj|T(t), то вероятность перехода ji близка к 1/2.

Все случаи соответствуют интуитивным ожиданиям.

Во втором условии в (65) сама сумма (без знака “минус”) равна суммарной вероятности перехода из состояния i во все остальные состояния. Так что эта сумма должна входить со знаком “минус” в выражение dPi(t)dt для темпа изменения вероятности Pi нахождения в состоянии i.

Третье условие в (65) означает, что рассматриваем только перевороты одиночных спинов (single-spin flip) в качестве допустимых переходов между состояниями системы.

Зависимость температуры от времени выбирается равной Γ(t):

T(t)=Γ(t)

Близость решения задачи SA к основному состоянию |g гамильтониана H^0 выражается величиной вероятности Pg(t) найти систему в основном состоянии в момент времени t:

PSA(t)=Pg(t)

Аналогично квантовому случаю, введем величину PSAst(T), которая в квазистатическом приближении близка к PSA(t) (если величина температуры T=T(t)).

Анализ и сравнение результатов#

В статье обсуждаются численные результаты для PSA и PQA для различных конфигураций обменного взаимодействия и различных вариантов зависимости поперечного поля от времени. В всех случаях продольное внешнее поле выбрано постоянным: h=0.1.

Ферромагнитная модель#

Здесь проводится численный эксперимент для ферромагнитной модели Изинга с Jij=const для всех пар спинов. Зависимости T и Γ от времени выбираются такими:

Γ(t)=T(t)=3ln(t+1)

Результаты представлены на Fig. 107.

../../../_images/fig_1.png

Fig. 107 Зависимости PSA(t), PQA(t), PSAst(T(t)) и PQAst(Γ(t)) для ферромагнитной модели при Γ(t)=T(t)=3/ln(t+1).#

Видно, что квазистатическое приближение работает очень хорошо, интересующие нас величины в динамическом процессе очень близки к вычисленным в равновесных условиях. Когда расписание отжига имеет вид T(t)=c/ln(t+1), гарантируется сходимость PSA1 при подходящем выборе константы c (в статье [KN98] есть ссылка на соответствующую теорему). Выбор константы c=3 достаточно произволен, но высокая точность приближенного равенства PSA(t)PSAst(T(t)) свидетельствует о том, что в рассматриваемом случае действительно PSA1 при t+.

Для QA нет аналогичного точного утверждения о сходимости PQA1, но численные результаты для данного ферромагнитного случая при Γ(t)=3/ln(t+1) позволяют предположить такую сходимость.

Тот факт, что QA-кривая на Fig. 107 всегда ниже SA-кривой, никакого значения не имеет, потому что в обеих задачах у нас все величины обезразмерены (=1 в (63) и единица времени τ=1 в (64)) и никакого согласования при обезразмеривании в двух задачах нет.

Если уменьшать поперечное поле и температуру быстрее,

Γ(t)=T(t)=3t,

то возникает качественное отличие QA и SA решений, см. Fig. 108.

../../../_images/fig_2.png

Fig. 108 Вид коэффициентов перекрытия для ферромагнитной модели при Γ(t)=T(t)=3/t.#

Видно, что решение квантовомеханической задачи лучше сходится к основному состоянию, чем решение классической задачи. Более того, SA-решение “застревает” в каком-то локальном минимуме с не очень малой вероятностью. На Fig. 109 виден темп приближения PQA к 1 (на графике двойная логарифмическая шкала). Можно сделать вывод, что (1PQA)1/t в широком диапазоне t.

../../../_images/fig_3.png

Fig. 109 (1PQA(t)) для ферромагнитной модели при Γ(t)=3/t.#

Если еще быстрее уменьшать поперечное поле и температуру,

Γ(t)=T(t)=3t,

то оба решения “застревают” в неосновных состояниях, как видно из Fig. 110.

../../../_images/fig_4.png

Fig. 110 Вид коэффициентов перекрытия для ферромагнитной модели при Γ(t)=T(t)=3/t.#

Фрустрированная модель#

Здесь анализируется так называемая фрустрированная (frustrated) система, она изображена на Fig. 111.

../../../_images/fig_5.png

Fig. 111 Фрустрированная система спинов.#

Сплошные линии обозначают ферромагнитное взаимодействие между спинами, пунктирная линия – антиферромагнитное взаимодействие (сила которого по абсолютной величине равна силе ферромагнитного взаимодействия). Если в SA-задаче температура очень велика, то спины 4 и 5 меняют свою ориентацию с очень высокой частотой, так что взаимодействие спинов 3 и 6 посредством спинов 4 и 5 пренебрежимо мало. В этом случае прямое антиферромагнитное взаимодействие между спинами 3 и 6 оказывается доминирующим, поэтому наблюдается отрицательная корреляция между ориентациями спинов 3 и 6 (см. Fig. 112).

../../../_images/fig_6.png

Fig. 112 Величина корреляции спинов 3 и 6. Индекс c означает классическое решение (SA), индекс q означает квантовомеханическое решение (QA).#

С другой стороны, при низкой температуре спины 4 и 5 стремятся принять определенную устойчивую ориентацию. В этом случае эффективное (непрямое) ферромагнитное взаимодействие между спинами 3 и 6 посредством спинов 4 и 5 примерно вдвое сильнее, чем прямое антиферромагнитное взаимодействие. Эти рассуждения подтверждаются положительной величиной корреляции σ3zσ6zc при низких температурах (Fig. 112). Значит, спины 3 и 6 должны поменять взаимную ориентацию при некоторой промежуточной температуре.

Если поперечное поле в QA-задаче играет роль, аналогичную роли температуры в SA-задаче, то следует ожидать схожего поведения величины корреляции σ3zσ6zq при изменении Γ. Здесь наблюдаемая σ3zσ6zq вычисляется с использованием основного состояния гамильтониана (62) при заданной Γ. Так и есть (см. пунктирную кривую на Fig. 112).

Если использовать расписание отжига

Γ(t)=T(t)=3t,

то получаются результаты, изображенные на Fig. 113.

../../../_images/fig_7.png

Fig. 113 Вид коэффициентов перекрытия для фрустрированной модели при Γ(t)=T(t)=3/t.#

Обезразмеренное время τ=tTc2 для SA-задачи и τ=tΓc2 для QA-задачи. Здесь Tc и Γc – критические величины, при которых σ3zσ6zc и σ3zσ6zq переходят через ноль на графике Fig. 112. Видно, что квантовый отжиг лучше подходит для поиска основного состояния в такой системе.

Модель со случайными взаимодействиями#

Последний рассмотренный пример – это модель спинового стекла, предложенная Шеррингтоном и Киркпатриком [SK75]. Для всех пар спинов есть взаимодействие, сила которого является случайной величиной и семплируется из гауссова распределения с нулевым средним и с дисперсией 1/N (в нашем случае N=8). На Fig. 114 показан типичный результат для эволюции коэффициентов перекрытия во времени при расписании отжига Γ(t)=T(t)=3/t.

../../../_images/fig_8.png

Fig. 114 Вид коэффициентов перекрытия для модели Шеррингтона-Киркпатрика при Γ(t)=T(t)=3/t.#

Было проверено несколько реализаций для коэффициентов обменного взаимодействия (семплирование выполнялось из одной и той же функции распределения), результаты оказались качественно близкими. Графики на Fig. 114 подтверждают, что для данной оптимизационной задачи квантовый отжиг подходит лучше, чем классический.

Заключение#

В этой лекции рассказали о канонической работе, в которой для модели Изинга рассмотрены классическая имитация отжига и квантовая имитация отжига, выполнен анализ и сравнение свойств решений в рамках этих двух подходов на нескольких примерах. Выяснилось, что:

  • при одном и том же расписании отжига квантовый отжиг дает сходимость к основному состоянию с большей вероятностью, чем классический отжиг;

  • для квантового случая система сходится к основному состоянию при расписании отжига Γ=c/t, но не при более быстром уменьшении поперечного поля;

  • для ферромагнитной модели при квантовом отжиге вероятность получения основного состояния ведет себя приближенно как (1constt) на больших временах t.