AIロボットによる完全自動イチゴ栽培を実現するHarvestX──「高火力 VRT」でAIモデルの学習時間を33%短縮。イチゴの花の検出率99%と国産クラウドの安全性を両立
- メーカー
HarvestX株式会社
- GPUサーバーサービス


北海道大学の電子科学研究所生体データサイエンス研究分野では、さくらインターネットの「高火力 DOK」が採用されています。用途は医療・ヘルスケア分野における「スモールデータ」の活用。心電図や脳波といった生体信号を解析し、疾患の早期発見や治療につなげる研究を進めています。 「大学の研究室」という環境で、国産のクラウドGPUはどのような価値をお届けできているのか。同研究室の教授、藤原幸一教授から、高火力 DOKを選んだ理由について、くわしく話を聞きました。

北海道大学 電子科学研究所の藤原幸一教授の研究室は、おもに機械学習を用いた医療データ解析の研究をおこなっています。医療AIといえば、一般的にイメージされるのは、CTやMRIなどの画像から病変をみつける「画像診断」ですが、藤原教授のターゲットはそれとは一線を画します。
「われわれは生体信号の解析に関する研究をしています。脳波や心電図、あるいは呼吸や睡眠データなどを用いて、疾患の早期診断やスクリーニング、治療に貢献することを目指しています。生体信号はそもそも取得しないことも多いうえ、患者数が少なく検査がほとんど実施されないため,データ自体が非常に少ない、いわゆる『スモールデータ』もあります。それらをどう扱い、どのように医療につなげるかを研究しています」(藤原教授)
生体信号は「波形」が収集されます。レントゲン撮影の画像のように「見てわかる」直感的な情報ではないため、解析にあたっては、属人的な「職人技」が求められることが多いそうです。たとえば脳波の信号は、現在でも専門家が一秒以下の粒度で波形をていねいに読み解いています。そのため、読む人によって解釈が変わったり、同じ人でも読み解きにゆれが出たりする、という課題がありました。
「たとえば画像であれば、猫の画像は誰が見ても猫です。しかし、生体信号の波形はそうはいきません。その判読が正解なのかがよくわからず、しかもデータが少ない。われわれは、こうした専門家でも判断が揺れる領域や、人では解析が難しい部分まで含めて、AIが安定して扱えるようにすることを目指しています。データを集めて試行錯誤しながらパラメーターをチューニングし、AIモデルを学習させる。そこにGPUの計算リソースを活用しています」(藤原教授)
さくらインターネットの「高火力 DOK」を導入する前、藤原教授の研究室では、おもに大学内の計算機や国の研究インフラとして提供されているスーパーコンピューターを活用する大規模計算環境を利用していました。しかし、研究の本質とは関係のない「ささいな面倒」が課題になっていたといいます。
「通常われわれは、まずローカル環境で小規模な計算をして、効果のめどを立ててから、スパコンの大規模環境を利用します。ローカルではDockerを使っているのですが、研究機関はSingularityにあわせる必要があり、まれにトラブルが起きていました。Singularityにあわせる作業そのものは、そう難しくはありません。しかし、その『ひと手間』が心理的な障壁になり、研究の勢いを削いでしまっていました」(藤原教授)
また、共有リソースならではの課題として「計算資源の奪いあい」も発生します。公共の施設として運営されている研究設備では、公的プロジェクトが優先されます。社会的な課題に関するジョブの発生によって、一時的に計算リソースが制限されてしまうことがありました。
「ちょうど計算を回したいタイミングで制限がかかってしまうと、研究のサイクルが止まってしまいます。必要なときに必要なリソースを確保できないのは悩みの種でした。そうしたなかで高火力 DOKのキャンペーンを見かけ、移行の検討を始めました」(藤原教授)
高火力 DOKを試用したあと、藤原教授はすぐに本採用を決めたといいます。最大の理由は、「圧倒的な容易さ」でした。
「本来、システムの乗り換えには、多くの手間や時間がかかります。しかし高火力 DOKは、ローカルのDocker環境をそのままコピーしてデータをアップロードするだけで動きました。サクッと試してそのまま実行でき、非常に使いやすい。本採用してから、とても研究を進めやすくなりました」(藤原教授)
導入後、実際に計算を回しているのは、おもに研究室の大学院生の方たちです。
「高火力 DOKへの移行をしてから、『学生が環境構築でつまずいている』という話を聞かなくなりました。軽い計算は手元で回し、自分のパソコンで実行するとほかの作業ができなくなるような重いジョブはクラウドに投げる……といった使い分けもスムーズにできています。Jupyter Notebookで対話的に試行錯誤ができるのもよいですね。大規模な探索をする前の、手元でお試し計算をしているときと同じ感覚で設定を詰められます。研究の手戻りが減り、効率が上がっていると感じます」(藤原教授)

研究に用いる医療データには、センシティブな情報が含まれることもあります。医療機関からデータの提供を受ける際、とくに秘匿性の高いデータは厳格な取り扱いが求められます。
「データの提供を受ける際の条件として、『データの保管場所』が非常に重要になるケースがあります。データ提供元によっては、外資系のサービスを使う場合、リージョンの場所やそのリージョンでの管理体制などを細かく説明する必要がありました。しかし、さくらインターネットであれば『国内のサービスだけを使っています』の一言で済みます。コンプライアンス説明のコストの低さは、医療系データを扱う研究者にとって強力な味方です」(藤原教授)
また、大学の予算執行体系にもメリットがあったといいます。
「研究予算は年度の3月31日までに執行する必要があります。プリペイドでチャージした予算分を確実に使い切ることができるのは、予算の管理上とても楽です。引き続き、日本の大学特有の事情にフィットした料金体系や会計処理を提案していただけたらうれしいですね。ほかの環境を使っていたときに予算管理を誤ってしまい、あとになってから数万円の請求が来て慌てたこともありましたから」(藤原教授)
藤原教授が見据えるのは、論文発表にとどまらない「AIの社会実装」です。論文を出すための研究成果ではなく、実際の医療現場で使われるシステムを構築したい。そのためには、計算機能をフルに活かした、現場への徹底的な最適化が欠かせません。
「どこまでパラメーターを詰めて、どのくらいチューニングを細かく回せるか。それがシステムの完成度を左右します。計算環境がパワフルで安定しているということは、それだけ試行回数を増やせるということです。社会実装に向けて、試行回数を最大化していきたいですね。また、今後は画像解析やLLMの活用も増えるでしょうし、将来的にはAnsysやMATLABといった商用ソフトウェアをGPU上で動かしたいというニーズも出てくるでしょう。それらも含めて、国内で完結する安定したインフラが支えてくれることは、日本の研究開発にとって大きな意味があると思います」(藤原教授)
生体信号解析という、医療AIの最前線。さくらインターネットでは研究者の創造性をブーストするお手伝いをコンテナ型国産GPU クラウド「高火力 DOK」で支援していきます。
※掲載の記事内容・情報は執筆時点のものです。
