사이트 등록
둘러보기로 이동
검색으로 이동
개요[편집 | 원본 편집]
구글 콘솔 서치나 네이버 서치어드바이저 등에 사이트를 등록해야 검색엔진에 노출된다.
구글[편집 | 원본 편집]
구글 서치콘솔.[편집 | 원본 편집]
사이트맵 등록.[편집 | 원본 편집]
- 기본적으로 https://www.mediawiki.org/wiki/Manual:GenerateSitemap.php를 참고.
- https://search.google.com/search-console/sitemaps?resource_id=sc-domain%3Asmwiki.info&hl=ko 에 url을 올린다.
- 가끔 갱신해주어야 함.(아래, 사이트맵 생성 명령어로 갱신)
| 과정 | 설명 | 비고 |
|---|---|---|
| 디렉토리 제작 |
|
|
| 사이트맵 생성 | php maintenance/run.php generateSitemap \
--memory-limit=50M \ --fspath=/var/www/html/sitemap/ \ --identifier=smwiki.info \ --urlpath=/sitemap/ \ --server=https://smwiki.info \ --compress=yes \ --skip-redirects |
|
| 사이트맵 권한 설정 | 이상하게 계정에 귀속된 파일들이 생성된다. 권한 다시 설정.
|
|
| nginx 설정 | # sitemap.xml 파일 제공(bot의 크롤링을 위해.)
location /sitemap/ {
root /var/www/html;
autoindex on;
allow all;
log_not_found off;
access_log off;
}
|
|
명령이 제대로 기입되면 "https://smwiki.info/sitemap/sitemap-index-smwiki.info.xml"가 사이트맵 주소가 된다.
robots.txt 등록[편집 | 원본 편집]
구글 봇이 크롤링을 할 수 있게 설정.
| 과정 | 설명 | 비고 |
|---|---|---|
| 웹서버 설정 | 루트 디렉토리에 robots.txt를 작성한다. |
|
| robots.txt 작성 | User-agent: *
# 불필요한 스크립트 파일 직접 접근 차단
Disallow: /index.php
Disallow: /load.php
Disallow: /api.php
Disallow: /rest.php
# 특수 문서 등 검색 불필요 페이지 차단
Disallow: /wiki/Special:
# 민감한 폴더 접근 차단 (Nginx 설정에서도 막았지만 robots.txt에서도 알려주는 게 좋음)
Disallow: /cache/
Disallow: /includes/
Disallow: /languages/
Disallow: /maintenance/
Disallow: /serialized/
Disallow: /store/
Disallow: /vendor/
# 이미지 폴더 자체 접근(목록) 차단 (images 폴더 안의 개별 이미지는 당연히 허용됨)
Disallow: /images/
# 미디어위키 리소스, 확장 기능, 스킨 등 필요한 파일 접근 허용 (Disallow보다 Allow 우선)
# Allow: 는 Disallow 규칙에 의해 막혔더라도 이 경로는 허용하겠다는 의미
# 루트(smwiki.info/)에서 바로 시작하는 경로로 수정
Allow: /resources/
Allow: /extensions/
Allow: /skins/
# 사이트맵 위치
Sitemap: https://smwiki.info/sitemap/sitemap-index-smwiki.info.xml
|
|