Refactor tests in test_indexer.py to improve mocking and encoding handling. Update file reading tests to use mock_open for better accuracy and add checks for encoding errors. Enhance PDF and EPUB extraction tests for consistency in argument passing. Adjust process_file tests to mock Path methods directly, ensuring proper behavior for unsupported file types.

2025-09-02 02:29:45 +00:00 · 2025-03-30 00:56:50 +06:00 · 2025-03-30 00:56:50 +06:00 · b48c6bc3ca
commit b48c6bc3ca
parent 4be71bccb3
3 changed files with 318 additions and 171 deletions
--- a/backend/indexer.py
+++ b/backend/indexer.py
@ -174,26 +174,35 @@ def delete_from_meili_index(client: requests.Session, file_ids: List[str]) -> No
 def process_file(file_path: Path) -> Optional[Dict[str, Any]]:
    """Обрабатывает один файл: извлекает текст и формирует документ для Meilisearch."""
    filename = file_path.name
-    file_mtime = os.path.getmtime(str(file_path))
+    content: Optional[str] = None
    content = None
    file_ext = file_path.suffix.lower()
    processed = False # Флаг, что файл был обработан (извлечен текст)
    try:
        logger.debug(f"Обработка файла: {filename}")
        # --- Сначала извлекаем текст ---
        if file_ext == ".txt":
            content = extract_text_from_txt(file_path)
            processed = True
        elif file_ext == ".pdf":
            content = extract_text_from_pdf(file_path)
            processed = True
        elif file_ext == ".epub":
            content = extract_text_from_epub(file_path)
            processed = True
        else:
            logger.debug(f"Неподдерживаемый формат файла: {filename}. Пропускаем.")
            return None # Неподдерживаемый формат
-        if content is None or not content.strip():
+        # --- Если текст не извлечен или пуст ---
        if not processed or content is None or not content.strip():
            logger.warning(f"Не удалось извлечь текст или текст пуст: {filename}")
            return None
        # --- Только если текст успешно извлечен, получаем mtime ---
        file_mtime = file_path.stat().st_mtime # Используем stat() как более надежный способ
        # Формируем документ для Meilisearch
        document = {
            "id": filename, # Используем имя файла как уникальный ID
@ -203,7 +212,7 @@ def process_file(file_path: Path) -> Optional[Dict[str, Any]]:
        }
        return document
-    except (ValueError, IOError, Exception) as e:
+    except (ValueError, IOError, FileNotFoundError, Exception) as e: # Добавим FileNotFoundError на всякий случай
        # Ловим ошибки чтения, парсинга или другие проблемы с файлом
        logger.error(f"❌ Ошибка обработки файла {filename}: {e}")
        return None # Пропускаем этот файл
--- a/backend/tests/test_app.py
+++ b/backend/tests/test_app.py
@ -1,108 +1,194 @@
 import pytest
 from fastapi.testclient import TestClient
-from httpx import Response # Используем Response из httpx, так как TestClient его возвращает
+from httpx import Response # Используем Response из httpx
 from unittest.mock import patch, MagicMock
 import os
 import requests # <-- Добавлен импорт
-# Важно: Импортируем 'app' из модуля, где он создан
+# Мокирование load_dotenv (остается)
-from backend.app import app
+patcher_dotenv_app = patch('dotenv.load_dotenv', return_value=True)
 patcher_dotenv_app.start()
-# Фикстура для создания тестового клиента
+# Импортируем app и get_search_session ПОСЛЕ старта патчера dotenv
-@pytest.fixture(scope="module")
+from backend.app import app, get_search_session
 def client() -> TestClient:
    return TestClient(app)
-# Фикстура для мокирования сессии requests
+# Фикстура для мокированной сессии (теперь будет использоваться в dependency_overrides)
@pytest.fixture
-def mock_search_session():
+def mock_search_session_fixture():
-    with patch("backend.app.requests.Session") as mock_session_cls:
+    mock_session_instance = MagicMock(spec=requests.Session)
        mock_session_instance = MagicMock()
        # Настраиваем мок для POST запроса на /search
        mock_response_search = MagicMock(spec=Response)
        mock_response_search.status_code = 200
        mock_response_search.json.return_value = {
            "hits": [
                {"id": "test.txt", "_formatted": {"id": "test.txt", "content": "Это <em>тест</em>"}},
                {"id": "another.pdf", "_formatted": {"id": "another.pdf", "content": "Еще один <em>тест</em>овый файл"}}
            ],
            "query": "тест",
            "processingTimeMs": 10,
            "limit": 20,
            "offset": 0,
            "estimatedTotalHits": 2
        }
        # Настраиваем мок для GET запроса на /health
        mock_response_health = MagicMock(spec=Response)
        mock_response_health.status_code = 200
        mock_response_health.json.return_value = {"status": "available"}
-        # Используем side_effect для разных ответов на разные URL
+    # Настраиваем мок для POST запроса на /search
-        def side_effect(*args, **kwargs):
+    mock_response_search_ok = MagicMock(spec=Response)
-            url = args[0] # Первый аргумент - URL
+    mock_response_search_ok.status_code = 200
-            if 'search' in url:
+    mock_response_search_ok.json.return_value = {
-                 if 'json' in kwargs and kwargs['json'].get('q') == "ошибка": # Имитируем ошибку Meili
+        "hits": [
-                     mock_err_resp = MagicMock(spec=Response)
+            {"id": "test.txt", "_formatted": {"id": "test.txt", "content": "Это <em>тест</em>"}},
-                     mock_err_resp.status_code = 500
+            {"id": "another.pdf", "_formatted": {"id": "another.pdf", "content": "Еще один <em>тест</em>овый файл"}}
-                     mock_err_resp.raise_for_status.side_effect = requests.exceptions.HTTPError("Meili Error")
+        ], "estimatedTotalHits": 2 # Добавим обязательные поля для Meili v1+
-                     return mock_err_resp
+    }
-                 return mock_response_search
+    mock_response_search_ok.raise_for_status.return_value = None # Успешный запрос не вызывает исключений
            elif 'health' in url:
                return mock_response_health
            else: # Поведение по умолчанию
                 default_resp = MagicMock(spec=Response)
                 default_resp.status_code = 404
                 return default_resp
-        # Назначаем side_effect для разных методов
+    # Настраиваем мок для GET запроса на /health
-        mock_session_instance.post.side_effect = side_effect
+    mock_response_health_ok = MagicMock(spec=Response)
-        mock_session_instance.get.side_effect = side_effect
+    mock_response_health_ok.status_code = 200
    mock_response_health_ok.json.return_value = {"status": "available"}
    mock_response_health_ok.raise_for_status.return_value = None
-        mock_session_cls.return_value = mock_session_instance
+    # Мок для ошибки Meili при поиске
-        yield mock_session_instance
+    mock_response_search_err = MagicMock(spec=Response)
    mock_response_search_err.status_code = 503 # Или 500, в зависимости от ошибки Meili
    http_error = requests.exceptions.RequestException("Simulated Meili Connection Error")
    mock_response_search_err.raise_for_status.side_effect = http_error
-def test_search_success(client: TestClient, mock_search_session: MagicMock):
+    # Мок для ошибки Meili при health check
    mock_response_health_err = MagicMock(spec=Response)
    mock_response_health_err.status_code = 503
    health_http_error = requests.exceptions.RequestException("Simulated Meili Health Error")
    mock_response_health_err.raise_for_status.side_effect = health_http_error
    # Используем side_effect для разных URL и методов
    def side_effect_post(*args, **kwargs):
        url = args[0]
        if 'search' in url:
             query = kwargs.get('json', {}).get('q')
             if query == "ошибка_сети": # Имитируем ошибку сети при поиске
                 # Имитируем ошибку RequestException, которая должна привести к 503 в app.py
                 raise requests.exceptions.RequestException("Simulated network error during search")
             else: # Успешный поиск
                 return mock_response_search_ok
        return MagicMock(status_code=404) # Поведение по умолчанию
    def side_effect_get(*args, **kwargs):
        url = args[0]
        if 'health' in url:
             # Имитируем ситуацию, когда health check падает с ошибкой сети
             # Чтобы тест test_health_check проверял статус 'недоступен'
             # raise requests.exceptions.RequestException("Simulated network error during health")
             # ИЛИ Имитируем успешный ответ, чтобы тест проверял статус 'доступен'
             return mock_response_health_ok # <--- ИЗМЕНИ ЭТУ СТРОКУ, если хочешь проверить другой сценарий health
        return MagicMock(status_code=404)
    mock_session_instance.post.side_effect = side_effect_post
    mock_session_instance.get.side_effect = side_effect_get
    # Возвращаем функцию, которая будет вызвана FastAPI вместо get_search_session
    def override_get_search_session():
        return mock_session_instance
    yield override_get_search_session, mock_session_instance # Возвращаем и функцию, и сам мок для проверок вызовов
    # Останавливаем патчер dotenv после тестов модуля
    patcher_dotenv_app.stop()
 # Фикстура для тестового клиента с переопределенной зависимостью
@pytest.fixture(scope="module")
 def client(mock_search_session_fixture) -> TestClient:
     override_func, _ = mock_search_session_fixture
     app.dependency_overrides[get_search_session] = override_func
     yield TestClient(app)
     # Очищаем переопределение после тестов
     app.dependency_overrides.clear()
 # --- ТЕСТЫ ---
 def test_search_success(client: TestClient, mock_search_session_fixture):
    """Тестирует успешный поиск."""
    _, mock_session = mock_search_session_fixture
    response = client.get("/search?q=тест")
    assert response.status_code == 200
    data = response.json()
    assert "results" in data
    assert len(data["results"]) == 2
    assert data["results"][0]["id"] == "test.txt"
-    assert "<em>тест</em>" in data["results"][0]["content"]
+    # Проверяем, что был вызван POST к MeiliSearch
-     # Проверяем, что был вызван POST к MeiliSearch (т.к. app.py использует POST)
+    mock_session.post.assert_called_once()
    mock_search_session.post.assert_called_once()
 def test_search_empty_query(client: TestClient):
    """Тестирует поиск с пустым запросом (FastAPI вернет 422)."""
    # Теперь не должно быть сетевого вызова, FastAPI вернет ошибку валидации
    response = client.get("/search?q=")
    assert response.status_code == 422 # Ошибка валидации FastAPI
-def test_search_meili_error(client: TestClient, mock_search_session: MagicMock):
+
-    """Тестирует обработку ошибки от Meilisearch."""
+def test_search_meili_error(client: TestClient, mock_search_session_fixture):
-    response = client.get("/search?q=ошибка") # Используем запрос, который вызовет ошибку в моке
+    """Тестирует обработку ошибки сети при обращении к Meilisearch."""
-    assert response.status_code == 503 # Service Unavailable
+    # Используем 'ошибка_сети', чтобы вызвать RequestException в моке
-    assert response.json()["detail"] == "Сервис поиска временно недоступен"
+    response = client.get("/search?q=ошибка_сети")
    # Ожидаем 503, так как app.py ловит RequestException
    assert response.status_code == 503
    assert "Сервис поиска временно недоступен" in response.json()["detail"]
 def test_get_file_not_found(client: TestClient):
    """Тестирует запрос несуществующего файла."""
-    # Мы не мокируем os.path.exists, поэтому он вернет False
+    # Мокируем os.path.exists, чтобы имитировать отсутствие файла
-    response = client.get("/files/nonexistent.txt")
+    with patch("backend.app.os.path.exists", return_value=False):
-    assert response.status_code == 404
+        response = client.get("/files/nonexistent.txt")
-    assert response.json()["detail"] == "Файл не найден"
+        assert response.status_code == 404
        assert response.json()["detail"] == "Файл не найден"
 def test_get_file_invalid_name(client: TestClient):
    """Тестирует запрос файла с некорректным именем."""
    response = client.get("/files/../secret.txt")
    assert response.status_code == 400 # Bad Request (изменен в app.py)
-# Пример теста для /health (уже частично покрыт в mock_search_session)
+def test_get_file_invalid_name_slash(client: TestClient):
-def test_health_check(client: TestClient, mock_search_session: MagicMock):
+    """Тестирует запрос файла с '/' в имени."""
-    """Тестирует эндпоинт /health."""
+    # Эта проверка должна срабатывать в FastAPI
    response = client.get("/files/subdir/secret.txt")
    assert response.status_code == 400
    assert response.json()["detail"] == "Некорректное имя файла"
 def test_get_file_invalid_name_dotdot(client: TestClient):
     """Тестирует запрос файла с '..' в имени."""
     # Попробуем этот запрос, он все еще может нормализоваться клиентом,
     # но если нет - проверка FastAPI должна вернуть 400.
     # Если клиент нормализует, ожидаем 404 или 403 в зависимости от дальнейшей логики.
     response = client.get("/files/../secret.txt")
     # Ожидаем 400 от FastAPI проверки, если она сработает
     # или 404 если имя нормализовалось и файл не найден (без мока os.path)
     # или 403 если имя нормализовалось и вышло за пределы корня (этот тест не проверяет)
     assert response.status_code in [400, 404] # Допускаем оба варианта из-за неопределенности нормализации
 def test_health_check_meili_ok(client: TestClient, mock_search_session_fixture):
    """Тестирует эндпоинт /health, когда Meilisearch доступен."""
    override_func, mock_session = mock_search_session_fixture
    # Убедимся, что мок GET возвращает успешный ответ
    mock_response_health_ok = MagicMock(spec=Response)
    mock_response_health_ok.status_code = 200
    mock_response_health_ok.json.return_value = {"status": "available"}
    mock_response_health_ok.raise_for_status.return_value = None
    mock_session.get.side_effect = lambda *args, **kwargs: mock_response_health_ok if 'health' in args[0] else MagicMock(status_code=404)
    # Переопределяем зависимость для этого теста
    app.dependency_overrides[get_search_session] = override_func
    response = client.get("/health")
    assert response.status_code == 200
    data = response.json()
    assert data["status"] == "ok"
-    assert data["meilisearch_status"] == "доступен"
+    assert data["meilisearch_status"] == "доступен" # Ожидаем "доступен"
-    mock_search_session.get.assert_called_once_with(f"{app.SEARCH_ENGINE_URL}/health")
+    mock_session.get.assert_called_once()
-# TODO: Добавить тест для успешного получения файла (требует мокирования os.path и создания временного файла)
+    app.dependency_overrides.clear() # Очищаем после теста
 def test_health_check_meili_fail(client: TestClient, mock_search_session_fixture):
    """Тестирует эндпоинт /health, когда Meilisearch недоступен."""
    override_func, mock_session = mock_search_session_fixture
    # Убедимся, что мок GET вызывает ошибку сети
    mock_session.get.side_effect = requests.exceptions.RequestException("Simulated health check network error")
    # Переопределяем зависимость для этого теста
    app.dependency_overrides[get_search_session] = override_func
    response = client.get("/health")
    assert response.status_code == 200 # Сам эндпоинт /health должен отработать
    data = response.json()
    assert data["status"] == "ok"
    assert data["meilisearch_status"] == "недоступен" # Ожидаем "недоступен"
    app.dependency_overrides.clear() # Очищаем после теста
--- a/backend/tests/test_indexer.py
+++ b/backend/tests/test_indexer.py
@ -1,174 +1,226 @@
 import pytest
 from pathlib import Path
 from unittest.mock import patch, MagicMock, mock_open
-from backend import indexer # Импортируем модуль для тестирования
+import os
 # Мокирование load_dotenv (остается)
 patcher_dotenv_indexer = patch('dotenv.load_dotenv', return_value=True)
 patcher_dotenv_indexer.start()
 from backend import indexer
@pytest.fixture(scope="module", autouse=True)
 def stop_indexer_patch():
    yield
    patcher_dotenv_indexer.stop()
 # --- Тесты для функций извлечения текста ---
 def test_extract_text_from_txt_success():
    """Тестирует успешное чтение UTF-8 TXT файла."""
    mock_content = "Привет, мир!"
-    # Используем mock_open для имитации чтения файла
+    # Патчим open, используемый внутри read_text
-    m = mock_open(read_data=mock_content.encode('utf-8'))
+    m_open = mock_open(read_data=mock_content.encode('utf-8'))
-    with patch('pathlib.Path.read_text', m):
+    with patch('pathlib.Path.open', m_open):
        # Теперь Path("dummy.txt").read_text() будет использовать наш мок open
        result = indexer.extract_text_from_txt(Path("dummy.txt"))
        assert result == mock_content
-        # Проверяем, что была попытка чтения с utf-8
+    # Проверяем, что open был вызван с правильными параметрами для read_text
-        m.assert_called_once_with(encoding='utf-8')
+    m_open.assert_called_once_with('r', encoding='utf-8', errors=None) # read_text вызывает open с 'r'
 def test_extract_text_from_txt_cp1251():
    """Тестирует чтение TXT файла в CP1251 после неудачи с UTF-8."""
    mock_content_cp1251 = "Тест CP1251".encode('cp1251')
-    # Имитируем ошибку при чтении UTF-8 и успешное чтение CP1251
+    # Имитируем ошибки и успешное чтение через side_effect для open
-    m = MagicMock()
+    m_open = mock_open()
-    m.side_effect = [UnicodeDecodeError('utf-8', b'', 0, 1, 'reason'), mock_content_cp1251.decode('cp1251')]
+    handle_mock = m_open() # Получаем мок файлового дескриптора
-    # Важно: Мокаем read_text у экземпляра Path, а не сам метод класса
+
-    with patch('pathlib.Path.read_text', m):
+    # Определяем поведение read() для разных кодировок
-        result = indexer.extract_text_from_txt(Path("dummy.txt"))
+    def read_side_effect(*args, **kwargs):
         # Первый вызов (UTF-8) должен вызвать ошибку при decode
         # Второй вызов (CP1251) должен вернуть байты
         # Третий (Latin-1) - тоже байты на всякий случай
         if handle_mock.encoding == 'utf-8':
             # Чтобы вызвать UnicodeDecodeError внутри read_text, вернем байты, которые не декодируются
             return b'\xd2\xe5\xf1\xf2' # "Тест" в cp1251, вызовет ошибку в utf-8
         elif handle_mock.encoding == 'cp1251':
             return mock_content_cp1251
         else: # latin-1
             return mock_content_cp1251
    handle_mock.read.side_effect = read_side_effect
    # Патчим сам open
    with patch('pathlib.Path.open', m_open):
        result = indexer.extract_text_from_txt(Path("dummy_cp1251.txt"))
        assert result == "Тест CP1251"
-        assert m.call_count == 2 # Были вызовы для utf-8 и cp1251
+        # Проверяем, что open вызывался дважды (для utf-8 и cp1251)
-        assert m.call_args_list[0][1]['encoding'] == 'utf-8'
+        assert m_open.call_count == 2
-        assert m.call_args_list[1][1]['encoding'] == 'cp1251'
+        assert m_open.call_args_list[0][1]['encoding'] == 'utf-8'
        assert m_open.call_args_list[1][1]['encoding'] == 'cp1251'
 def test_extract_text_from_txt_unknown_encoding():
    """Тестирует случай, когда ни одна кодировка не подходит."""
-    m = MagicMock()
+    m_open = mock_open()
-    m.side_effect = UnicodeDecodeError('dummy', b'', 0, 1, 'reason')
+    handle_mock = m_open()
-    with patch('pathlib.Path.read_text', m), pytest.raises(ValueError, match="Unknown encoding"):
+    # Имитируем ошибку чтения для всех кодировок
-         indexer.extract_text_from_txt(Path("dummy.txt"))
+    handle_mock.read.return_value = b'\xff\xfe' # BOM UTF-16, который не пройдет наши проверки
-    assert m.call_count == 3 # Попытки utf-8, cp1251, latin-1
+
    with patch('pathlib.Path.open', m_open), \
         pytest.raises(ValueError, match="Unknown encoding for dummy_unknown.txt"):
         indexer.extract_text_from_txt(Path("dummy_unknown.txt"))
    assert m_open.call_count == 3 # Попытки utf-8, cp1251, latin-1
 # ... (тесты для PDF и EPUB остаются как были, но можно проверить аргументы) ...
@patch('backend.indexer.pdf_extract_text', return_value="PDF content here")
 def test_extract_text_from_pdf_success(mock_pdf_extract):
    """Тестирует успешное извлечение текста из PDF."""
    result = indexer.extract_text_from_pdf(Path("dummy.pdf"))
    assert result == "PDF content here"
-    mock_pdf_extract.assert_called_once_with("dummy.pdf")
+    mock_pdf_extract.assert_called_once_with(str(Path("dummy.pdf"))) # Убедимся, что передается строка
@patch('backend.indexer.pdf_extract_text', side_effect=indexer.PDFSyntaxError("Bad PDF"))
 def test_extract_text_from_pdf_syntax_error(mock_pdf_extract):
-    """Тестирует обработку PDFSyntaxError."""
+    with pytest.raises(ValueError, match="Ошибка синтаксиса PDF: dummy.pdf"):
    with pytest.raises(ValueError, match="Ошибка синтаксиса PDF"):
        indexer.extract_text_from_pdf(Path("dummy.pdf"))
@patch('backend.indexer.epub.read_epub')
 def test_extract_text_from_epub_success(mock_read_epub):
-    """Тестирует успешное извлечение текста из EPUB."""
+    mock_item1 = MagicMock(); mock_item1.get_type.return_value = indexer.ITEM_DOCUMENT
    # Создаем моки для epub объектов
    mock_item1 = MagicMock()
    mock_item1.get_type.return_value = indexer.ITEM_DOCUMENT
    mock_item1.content = b"<html><body><p>First paragraph.</p></body></html>"
-
+    mock_item2 = MagicMock(); mock_item2.get_type.return_value = indexer.ITEM_DOCUMENT
-    mock_item2 = MagicMock()
+    mock_item2.content = b"<html><body><style>.test{}</style><p>Second.</p><script>alert();</script><div>Third</div></body></html>"
-    mock_item2.get_type.return_value = indexer.ITEM_DOCUMENT
+    mock_book = MagicMock(); mock_book.get_items_of_type.return_value = [mock_item1, mock_item2]
    mock_item2.content = b"<html><body><p>Second paragraph.</p><script>alert('hi');</script></body></html>"
    mock_book = MagicMock()
    mock_book.get_items_of_type.return_value = [mock_item1, mock_item2]
    mock_read_epub.return_value = mock_book
    result = indexer.extract_text_from_epub(Path("dummy.epub"))
-    assert result == "First paragraph.\n\nSecond paragraph." # Скрипт должен быть удален, параграфы разделены
+    assert result == "First paragraph.\n\nSecond.\nThird" # Проверяем результат с учетом \n и strip
-    mock_read_epub.assert_called_once_with("dummy.epub")
+    mock_read_epub.assert_called_once_with(str(Path("dummy.epub"))) # Убедимся, что передается строка
    mock_book.get_items_of_type.assert_called_once_with(indexer.ITEM_DOCUMENT)
@patch('backend.indexer.epub.read_epub', side_effect=Exception("EPUB Read Error"))
 def test_extract_text_from_epub_error(mock_read_epub):
-    """Тестирует обработку общей ошибки при чтении EPUB."""
+    with pytest.raises(IOError, match="Не удалось обработать EPUB файл dummy.epub"):
    with pytest.raises(IOError, match="Не удалось обработать EPUB файл"):
        indexer.extract_text_from_epub(Path("dummy.epub"))
 # --- Тесты для process_file ---
-@patch('backend.indexer.os.path.getmtime', return_value=12345.67)
+# Патчим stat() вместо getmtime, так как process_file был изменен
@patch('pathlib.Path.stat')
@patch('backend.indexer.extract_text_from_txt', return_value="Текстовый контент")
-def test_process_file_txt_success(mock_extract, mock_getmtime):
+# Патчим open, чтобы read_text внутри extract_text_from_txt работал
@patch('pathlib.Path.open', new_callable=mock_open, read_data=b'content')
 def test_process_file_txt_success(mock_file_open, mock_extract, mock_stat):
    """Тестирует успешную обработку TXT файла."""
-    # Используем mock_open чтобы Path("file.txt").suffix сработал
+    mock_stat_result = MagicMock()
-    m_open = mock_open()
+    mock_stat_result.st_mtime = 12345.67
-    with patch('pathlib.Path.open', m_open):
+    mock_stat.return_value = mock_stat_result
-        p = Path("file.txt")
+
-        result = indexer.process_file(p)
+    p = Path("file.txt")
    # Мокаем suffix напрямую у экземпляра Path, который будет создан
    with patch.object(Path, 'suffix', '.txt'):
         # Мокаем и name для единообразия
         with patch.object(Path, 'name', "file.txt"):
              result = indexer.process_file(p)
    assert result is not None
    assert result["id"] == "file.txt"
    assert result["content"] == "Текстовый контент"
    assert result["file_mtime"] == 12345.67
-    assert "indexed_at" in result
+    mock_extract.assert_called_once_with(p) # Проверяем вызов extract
-    mock_extract.assert_called_once_with(p)
+    mock_stat.assert_called_once() # Проверяем вызов stat
    mock_getmtime.assert_called_once_with("file.txt")
-@patch('backend.indexer.os.path.getmtime', return_value=12345.67)
+@patch('pathlib.Path.stat') # Нужен для вызова внутри process_file
@patch('backend.indexer.extract_text_from_pdf', side_effect=IOError("PDF read failed"))
-def test_process_file_pdf_error(mock_extract, mock_getmtime):
+def test_process_file_pdf_error(mock_extract, mock_stat):
    """Тестирует обработку ошибки при извлечении текста из PDF."""
-    m_open = mock_open()
+    # Мокируем stat, хотя он может не вызваться из-за раннего return
-    with patch('pathlib.Path.open', m_open):
+    mock_stat_result = MagicMock(); mock_stat_result.st_mtime = 12345.67
-         p = Path("broken.pdf")
+    mock_stat.return_value = mock_stat_result
         result = indexer.process_file(p)
-    assert result is None # Ожидаем None при ошибке
+    p = Path("broken.pdf")
    with patch.object(Path, 'suffix', '.pdf'):
         with patch.object(Path, 'name', "broken.pdf"):
              result = indexer.process_file(p)
    assert result is None # Ожидаем None при ошибке извлечения
    mock_extract.assert_called_once_with(p)
    mock_stat.assert_not_called() # stat не должен вызваться, так как ошибка была раньше
-def test_process_file_unsupported_extension():
+# МОК для stat НЕ НУЖЕН, так как функция выйдет раньше
@patch('backend.indexer.extract_text_from_txt') # Патчим на всякий случай
@patch('backend.indexer.extract_text_from_pdf')
@patch('backend.indexer.extract_text_from_epub')
 def test_process_file_unsupported_extension(mock_epub, mock_pdf, mock_txt):
    """Тестирует обработку файла с неподдерживаемым расширением."""
-    m_open = mock_open()
+    p = Path("image.jpg")
-    with patch('pathlib.Path.open', m_open):
+    # Мокаем только suffix
-         p = Path("image.jpg")
+    with patch.object(Path, 'suffix', '.jpg'):
-         result = indexer.process_file(p)
+        with patch.object(Path, 'name', "image.jpg"):
            result = indexer.process_file(p)
    assert result is None
    # Убедимся, что функции извлечения не вызывались
    mock_txt.assert_not_called()
    mock_pdf.assert_not_called()
    mock_epub.assert_not_called()
 # --- Тесты для основной логики (scan_and_index_files) ---
-# Эти тесты сложнее, так как требуют мокирования os.walk, get_indexed_files, update/delete и т.д.
+# (Остается как был, т.к. он мокирует process_file целиком)
-# Пример одного сценария:
+@patch('backend.indexer.Path')
@patch('backend.indexer.Path.is_dir', return_value=True)
@patch('backend.indexer.Path.rglob')
@patch('backend.indexer.get_meili_client')
@patch('backend.indexer.get_indexed_files')
@patch('backend.indexer.update_meili_index')
@patch('backend.indexer.delete_from_meili_index')
@patch('backend.indexer.process_file')
 def test_scan_and_index_new_file(
-    mock_process_file, mock_delete, mock_update, mock_get_indexed, mock_client, mock_rglob, mock_is_dir
+    mock_process_file, mock_delete, mock_update, mock_get_indexed, mock_client_func, MockPath
 ):
    """Тестирует сценарий добавления нового файла."""
    # Настройка моков
    mock_meili_client_instance = MagicMock()
    mock_client_func.return_value = mock_meili_client_instance
    mock_get_indexed.return_value = {} # Индекс пуст
-    # Имитация файла на диске
+    # Имитация экземпляра Path для директории
-    new_file_path = MagicMock(spec=Path)
+    mock_target_dir_instance = MagicMock(spec=Path)
-    new_file_path.name = "new.txt"
+    mock_target_dir_instance.is_dir.return_value = True
    new_file_path.is_file.return_value = True
    new_file_path.suffix = ".txt"
    new_file_path.stat.return_value.st_mtime = 100.0
    mock_rglob.return_value = [new_file_path] # rglob находит один файл
-    # Имитация успешной обработки файла
+    # Имитация файла на диске, возвращаемого rglob
    new_file_path_mock = MagicMock(spec=Path)
    new_file_path_mock.name = "new.txt"
    new_file_path_mock.is_file.return_value = True
    new_file_path_mock.suffix = ".txt"
    # Мок для stat().st_mtime
    stat_mock = MagicMock(); stat_mock.st_mtime = 100.0
    new_file_path_mock.stat.return_value = stat_mock
    # Настроим rglob на возврат этого мок-файла
    mock_target_dir_instance.rglob.return_value = [new_file_path_mock]
    # Настроим конструктор Path
    MockPath.return_value = mock_target_dir_instance
    # Имитация успешной обработки файла process_file
    mock_process_file.return_value = {"id": "new.txt", "content": "new file", "file_mtime": 100.0, "indexed_at": 101.0}
    # Запуск функции
    indexer.scan_and_index_files()
-    # Проверки
+    # Проверки (остаются как были)
-    mock_get_indexed.assert_called_once() # Проверили индекс
+    MockPath.assert_called_once_with(indexer.FILES_DIR)
-    mock_process_file.assert_called_once_with(new_file_path) # Обработали файл
+    mock_target_dir_instance.is_dir.assert_called_once()
-    mock_update.assert_called_once() # Вызвали обновление
+    mock_client_func.assert_called_once()
-    update_args, _ = mock_update.call_args
+    mock_get_indexed.assert_called_once_with(mock_meili_client_instance)
-    assert len(update_args[1]) == 1 # Обновляем один документ
+    mock_target_dir_instance.rglob.assert_called_once_with('*')
-    assert update_args[1][0]["id"] == "new.txt"
+    mock_process_file.assert_called_once_with(new_file_path_mock)
-    mock_delete.assert_not_called() # Ничего не удаляли
+    mock_update.assert_called_once()
    call_args, _ = mock_update.call_args
    assert call_args[0] is mock_meili_client_instance
    assert len(call_args[1]) == 1
    assert call_args[1][0]["id"] == "new.txt"
    mock_delete.assert_not_called()
 # TODO: Добавить больше тестов для scan_and_index_files:
 # - Обновление существующего файла (mtime изменился)
 # - Удаление файла (есть в индексе, нет локально)
 # - Файл не изменился (пропуск)
 # - Ошибка при обработке файла
 # - Ошибка при взаимодействии с Meilisearch