【サーバ】CloudflareのSSL/TLS自動モードのせいで突然サーバーエラーが発生した話
2024年8月に「Cloudflareが自動SSL/TLSモードを導入、オリジンサーバーへの接続モードを自動で選定可能に」なっていたようで、一部のサービスが不安定になっていました。
自動モードではなく、従来通りの設定(カスタム SSL/TLSから「フレキシブル」を選ぶ)と不安定になることは無くなりました。
何があった
最初は、Chromeでアクセスするとnginxが時々404エラーになる現象が発生していました。毎回ではなく不定期に発生しており、Firefoxなどでは問題がなかったんですよね。
このようなランダム性のある時間差の不具合は、Cloudflare関連だろうと思いましたが、全く同じ設定なのに問題なく動いているドメインもあったので、意味がわかりません。
その後、24時間後ぐらいには全てのブラウザで404エラーが発生。さらに時間が経過した後、Cloudflareの「Invalid SSL certificateError code 526」エラー画面が表示された。
つまり?
運用中のサービスは、CloudflareのSSLが「フレキシブル」でないと動かない設定だったのに、自動モードのせいで勝手に「厳密」だのなんだのに変更されちゃってたんですね。
確認したときはフレキシブルだった筈ですが、時間差でコロコロ変わっていたようです。さらにDNSキャッシュの影響もあり、ブラウザやドメインによって挙動が違っていたと。
これを既存ドメイン含めてデフォルト設定にしてしまうとは、さすがCloudflareさん…。
まとめ
去年は決済系周りの不具合(PayPalが使えない、請求書が発行できない等)もありました。毎年トラブルが起きるCloudflare…。受託案件では使いたくないなと心から思います笑。