【サーバ】CloudflareのSSL/TLS自動モードのせいで突然サーバーエラーが発生した話

2024年8月に「Cloudflareが自動SSL/TLSモードを導入、オリジンサーバーへの接続モードを自動で選定可能に」なっていたようで、一部のサービスが不安定になっていました。

自動モードではなく、従来通りの設定(カスタム SSL/TLSから「フレキシブル」を選ぶ)と不安定になることは無くなりました。

何があった

最初は、Chromeでアクセスするとnginxが時々404エラーになる現象が発生していました。毎回ではなく不定期に発生しており、Firefoxなどでは問題がなかったんですよね。

このようなランダム性のある時間差の不具合は、Cloudflare関連だろうと思いましたが、全く同じ設定なのに問題なく動いているドメインもあったので、意味がわかりません。

その後、24時間後ぐらいには全てのブラウザで404エラーが発生。さらに時間が経過した後、Cloudflareの「Invalid SSL certificateError code 526」エラー画面が表示された。

つまり?

運用中のサービスは、CloudflareのSSLが「フレキシブル」でないと動かない設定だったのに、自動モードのせいで勝手に「厳密」だのなんだのに変更されちゃってたんですね。

確認したときはフレキシブルだった筈ですが、時間差でコロコロ変わっていたようです。さらにDNSキャッシュの影響もあり、ブラウザやドメインによって挙動が違っていたと。

これを既存ドメイン含めてデフォルト設定にしてしまうとは、さすがCloudflareさん…。

まとめ

去年は決済系周りの不具合(PayPalが使えない、請求書が発行できない等)もありました。毎年トラブルが起きるCloudflare…。受託案件では使いたくないなと心から思います笑。