メルカリのSite Reliability Engineeringチーム(以下、SREチーム)が発足したのは、2015年11月。当初から現在に至るまで、フリマアプリ「メルカリ」の信頼性向上のため、JP版やUS版をはじめ、メルカリグループが運営しているサービスのシステム運用業務を担当してきました。その一方で、ソースコードに直接手を加えてパフォーマンスを改善するなど、ソフトウェアエンジニア的な役割も担ってきた一面もあります。
システム全体を見ているチームということは、サービスや事業の成長とともに、その役割も変化していくということ。メルカリはSREチーム発足当時に比べて、組織や事業も拡大し、さらにはメルペイなどの新サービスも登場しています。そんななか、SREチームはどのようなフェーズに進もうとしているのでしょうか?
今回のメルカンでは、SREチームのエンジニアリングマネージャー(以下、EM)を担当した経験がある星野将と、エンジニアリングマネージャーをマネジメントするEngineering Manager of Engineering Managers(以下、EMofEMs)の田中慎司によるインタビューを実施。話を聞いてみると、SREチームは今、メルカリ史上最も大きな「山場」を迎えようとしているのだとか? その現状を取材しました。
サービスや事業とともに変化する、SREチームの役割
ーメルカリのSREチームは発足当時からスペシャリストが揃っていると、業界内でも言われていました。お2人は入社当時、どう感じていたのでしょうか?
星野:私は2017年にメルカリのSREチームへジョインしました。おっしゃるとおり、当時すでに、日本シリーズで何連覇もできそうなメンバーが揃っていましたね(笑)。とはいえ、私と前々職時代から一緒に働いていたメンバーも多く在籍していたので、入社前後でのギャップはありませんでした。
田中:僕も星野さんと同じく、前職からやりとりのあったメンバーがほとんどでした。なので、特に緊張することなく、チームに馴染めましたね。
ーしかし、当時に比べて、メルカリグループでは開発手法の1つであるマイクロサービスへの切り替えを本格始動させていたり、メルペイがリリースされるなど、変化のタイミングでもありました。このような変化を受け、SREチームは今どのような状態になっているのでしょうか?
星野:SREチームのミッションは、サービスの根幹を支え、運用すること。そのため、サービスや事業だけでなく、組織規模とともに求められる役割も変化します。まずマイクロサービス化に関しては、本格始動したばかりのころはSREチーム内でサービスの基盤となる部分をつくる役割を担っていました。2018年からは、SREチームの業務とマイクロサービス化の業務を組織上で分けることになり、Microservices Platformチームが誕生しました。当時は、私がSREチームとMicroservices PlatformチームのEMを兼任していました。
田中:これは、マイクロサービス化のプロジェクトが進むにつれて、求められる役割が大きくなった背景があります。そもそも、マイクロサービスが成立すれば、各開発チームがそれぞれのサービスを管理・運用していくことになります。これまでのメルカリグループでは、インフラ部分に触れるのはSREチームのみでしたが、今後そうはいきません。Microservices Platformチームの誕生は、まさに各サービスの根幹を支える体制づくりの一環なのです。
星野:そして今、私はMicroservices PlatformチームのEMを専任。SREチームのEMは、組織上ではSREチームを含むグループのEMofEMsである田中さんが兼務しています。
マイクロサービス化によって、世界標準なSREチームになる?
ーサービスや事業、組織規模とともにSREチームに求められる役割も変化すると話していました。では、マイクロサービス化によってSREチームの立ち位置はどのように変化するのでしょうか?
星野:マイクロサービス化は、メルカリの開発組織が拡大しても各チームがそれぞれ意思決定を行い、効率的な開発を進められる体制をつくるためのプロジェクトです。根幹部分を変えるプロジェクトでもあるので、各開発チームに及ぼす影響はとても大きい。そのため、BackendチームとMicroservices Platformチームが連携して取り組んでいます。SREチームは、その後追いをするかたちでマイクロサービスが完了したあとのシステム管理や運用を考えているところです。
ーつまり、マイクロサービス化の進捗を見つつ、SREチームで今後の運用などを議論しているということでしょうか?
田中:そうです。マイクロサービス化は、来年まで続く大規模なプロジェクトです。そして、このプロジェクトは現在進行中。SREチームはシステム管理や運用がメイン業務なので、今の段階で「SREチームはこうなる」とはっきり断言できません。しかし、チーム内ではいくつか予想を立てつつ、今後の役割について密に話し合っているところではありますね。
ーその「予想」とは?
田中:SREの定義は、各社によってさまざまです。マイクロサービス化が進んでいる企業は、メルカリに比べて個々のSREの担当領域が相対的に狭いんです。マイクロサービスが完了すれば、メルカリもそのような企業と同じく、サービスごとに切り分けてシステム管理や運用を行えます。そういった意味では、今までに比べて担当領域が狭くなるので、世界標準なSREチームのスタイルに近づくのではないかと予想しています。
「メルカリ史上最も大きな山場」は誂え向きのステージ
ーそして、メルカリグループの大きな変化として決済サービス「メルペイ」のリリースがありました。この大きな変化についてはどう感じていますか?
星野:メルペイが登場したことで、メルカリグループはシステム上で決済サービスを提供する状態になりました。そうすると、当然ながらSREチームに求められるレベルがもう一段上がることになります。これまでは守りの姿勢がベースでしたが、今後は積極的に品質を上げていくために攻めの取り組みも必要となる場合があるように感じています。
田中:そうですね。いわゆる金融事業は、トラディッショナルなイメージに捉えられることが多いと思います。しかし、メルカリグループではあくまでも「お客さま視点」を重視。トラディッショナルな視点は持ちつつ、お客さまから真に求められる品質やセキュリティを金融サービスレベルでも提供できる状態を目指しています。メルカリグループとしても初体験となる、非常にチャレンジングなフェーズに来ているかもしれませんね。
ー当然ですが、メルペイはセキュリティレベルが高いけれど、メルカリはそこそこでいいなんてことは許されません。
田中:そのとおりです。サービスのセキュリティレベルの難易度も上がるため、そのあたりをどうやってシステムにフィットさせていくか。これは引き続き課題ですね。
星野:お気づきかもしれませんが、私は現在Microservices PlatformチームのEM、そして田中さんはEMofEMsとSREチームのEMを兼務しています。つまり現在、SREチームには専任のEMがいない状態なのです。
ー社内でもっともエキサイティングなポジションが!
星野:そうなんです(笑)。今年から来年にかけて進めていくマイクロサービス化、そしてメルペイの登場。メルカリのSREチームはまさに、今じゃないと体験できない山場を迎えようとしています。私自身、EMとしてのやりがいは「1人では成し得ない、大きなことができる」でした。SREチームには特にスペシャリストが揃っているので、そのスケールは桁違いです。もしかすると、これから迎えようとしている山場は、新たな挑戦がしたいEMにとって誂え向き(あつらえむき)のステージなのかもしれません。
田中:確かに、今までにないレベルの山場ですよね(笑)。なかなか体験できないフェーズなので、EMとしても楽しめるんじゃないかと思います。そして、マイクロサービス化を完遂した後、SREチームの姿はどうなっているのか。それがメルカリグループとして導き出した「SREとしての答え」なんですよね。
プロフィール
-
星野将(Masaru Hoshino)
2017年2月に株式会社メルカリに入社。もともとBackendエンジニアでありながら、主に「開発のための開発」業務を担当してきた。現在はMicroservices Platform の Engineering Manager。
-
田中慎司(Shinji Tanaka)
NTT研究所を経て、2006年株式会社はてなに参画、2010年よりCTOとして技術全般を統括、並行して事業責任者等も兼務。2016年9月より執行役員としてメルカリに参画。メルカリUKにて開発チーム立ち上げ後、メルカリJPにてSREのEMofEMsに着任。