linux/block/blk-settings.c

86db1e29SJens Axboe/*
86db1e29SJens Axboe * Functions related to setting various queue properties from drivers
86db1e29SJens Axboe */
86db1e29SJens Axboe#include <linux/kernel.h>
86db1e29SJens Axboe#include <linux/module.h>
86db1e29SJens Axboe#include <linux/init.h>
86db1e29SJens Axboe#include <linux/bio.h>
86db1e29SJens Axboe#include <linux/blkdev.h>
86db1e29SJens Axboe#include <linux/bootmem.h>	/* for max_pfn/max_low_pfn */
86db1e29SJens Axboe
86db1e29SJens Axboe#include "blk.h"
86db1e29SJens Axboe
6728cb0eSJens Axboeunsigned long blk_max_low_pfn;
86db1e29SJens AxboeEXPORT_SYMBOL(blk_max_low_pfn);
6728cb0eSJens Axboe
6728cb0eSJens Axboeunsigned long blk_max_pfn;
86db1e29SJens Axboe
86db1e29SJens Axboe/**
86db1e29SJens Axboe * blk_queue_prep_rq - set a prepare_request function for queue
86db1e29SJens Axboe * @q:		queue
86db1e29SJens Axboe * @pfn:	prepare_request function
86db1e29SJens Axboe *
86db1e29SJens Axboe * It's possible for a queue to register a prepare_request callback which
86db1e29SJens Axboe * is invoked before the request is handed to the request_fn. The goal of
86db1e29SJens Axboe * the function is to prepare a request for I/O, it can be used to build a
86db1e29SJens Axboe * cdb from the request data for instance.
86db1e29SJens Axboe *
86db1e29SJens Axboe */
86db1e29SJens Axboevoid blk_queue_prep_rq(struct request_queue *q, prep_rq_fn *pfn)
86db1e29SJens Axboe{
86db1e29SJens Axboe	q->prep_rq_fn = pfn;
86db1e29SJens Axboe}
86db1e29SJens AxboeEXPORT_SYMBOL(blk_queue_prep_rq);
86db1e29SJens Axboe
86db1e29SJens Axboe/**
fb2dce86SDavid Woodhouse * blk_queue_set_discard - set a discard_sectors function for queue
fb2dce86SDavid Woodhouse * @q:		queue
fb2dce86SDavid Woodhouse * @dfn:	prepare_discard function
fb2dce86SDavid Woodhouse *
fb2dce86SDavid Woodhouse * It's possible for a queue to register a discard callback which is used
fb2dce86SDavid Woodhouse * to transform a discard request into the appropriate type for the
fb2dce86SDavid Woodhouse * hardware. If none is registered, then discard requests are failed
fb2dce86SDavid Woodhouse * with %EOPNOTSUPP.
fb2dce86SDavid Woodhouse *
fb2dce86SDavid Woodhouse */
fb2dce86SDavid Woodhousevoid blk_queue_set_discard(struct request_queue *q, prepare_discard_fn *dfn)
fb2dce86SDavid Woodhouse{
fb2dce86SDavid Woodhouse	q->prepare_discard_fn = dfn;
fb2dce86SDavid Woodhouse}
fb2dce86SDavid WoodhouseEXPORT_SYMBOL(blk_queue_set_discard);
fb2dce86SDavid Woodhouse
fb2dce86SDavid Woodhouse/**
86db1e29SJens Axboe * blk_queue_merge_bvec - set a merge_bvec function for queue
86db1e29SJens Axboe * @q:		queue
86db1e29SJens Axboe * @mbfn:	merge_bvec_fn
86db1e29SJens Axboe *
86db1e29SJens Axboe * Usually queues have static limitations on the max sectors or segments that
86db1e29SJens Axboe * we can put in a request. Stacking drivers may have some settings that
86db1e29SJens Axboe * are dynamic, and thus we have to query the queue whether it is ok to
86db1e29SJens Axboe * add a new bio_vec to a bio at a given offset or not. If the block device
86db1e29SJens Axboe * has such limitations, it needs to register a merge_bvec_fn to control
86db1e29SJens Axboe * the size of bio's sent to it. Note that a block device *must* allow a
86db1e29SJens Axboe * single page to be added to an empty bio. The block device driver may want
86db1e29SJens Axboe * to use the bio_split() function to deal with these bio's. By default
86db1e29SJens Axboe * no merge_bvec_fn is defined for a queue, and only the fixed limits are
86db1e29SJens Axboe * honored.
86db1e29SJens Axboe */
86db1e29SJens Axboevoid blk_queue_merge_bvec(struct request_queue *q, merge_bvec_fn *mbfn)
86db1e29SJens Axboe{
86db1e29SJens Axboe	q->merge_bvec_fn = mbfn;
86db1e29SJens Axboe}
86db1e29SJens AxboeEXPORT_SYMBOL(blk_queue_merge_bvec);
86db1e29SJens Axboe
86db1e29SJens Axboevoid blk_queue_softirq_done(struct request_queue *q, softirq_done_fn *fn)
86db1e29SJens Axboe{
86db1e29SJens Axboe	q->softirq_done_fn = fn;
86db1e29SJens Axboe}
86db1e29SJens AxboeEXPORT_SYMBOL(blk_queue_softirq_done);
86db1e29SJens Axboe
242f9dcbSJens Axboevoid blk_queue_rq_timeout(struct request_queue *q, unsigned int timeout)
242f9dcbSJens Axboe{
242f9dcbSJens Axboe	q->rq_timeout = timeout;
242f9dcbSJens Axboe}
242f9dcbSJens AxboeEXPORT_SYMBOL_GPL(blk_queue_rq_timeout);
242f9dcbSJens Axboe
242f9dcbSJens Axboevoid blk_queue_rq_timed_out(struct request_queue *q, rq_timed_out_fn *fn)
242f9dcbSJens Axboe{
242f9dcbSJens Axboe	q->rq_timed_out_fn = fn;
242f9dcbSJens Axboe}
242f9dcbSJens AxboeEXPORT_SYMBOL_GPL(blk_queue_rq_timed_out);
242f9dcbSJens Axboe
ef9e3facSKiyoshi Uedavoid blk_queue_lld_busy(struct request_queue *q, lld_busy_fn *fn)
ef9e3facSKiyoshi Ueda{
ef9e3facSKiyoshi Ueda	q->lld_busy_fn = fn;
ef9e3facSKiyoshi Ueda}
ef9e3facSKiyoshi UedaEXPORT_SYMBOL_GPL(blk_queue_lld_busy);
ef9e3facSKiyoshi Ueda
86db1e29SJens Axboe/**
86db1e29SJens Axboe * blk_queue_make_request - define an alternate make_request function for a device
86db1e29SJens Axboe * @q:  the request queue for the device to be affected
86db1e29SJens Axboe * @mfn: the alternate make_request function
86db1e29SJens Axboe *
86db1e29SJens Axboe * Description:
86db1e29SJens Axboe *    The normal way for &struct bios to be passed to a device
86db1e29SJens Axboe *    driver is for them to be collected into requests on a request
86db1e29SJens Axboe *    queue, and then to allow the device driver to select requests
86db1e29SJens Axboe *    off that queue when it is ready.  This works well for many block
86db1e29SJens Axboe *    devices. However some block devices (typically virtual devices
86db1e29SJens Axboe *    such as md or lvm) do not benefit from the processing on the
86db1e29SJens Axboe *    request queue, and are served best by having the requests passed
86db1e29SJens Axboe *    directly to them.  This can be achieved by providing a function
86db1e29SJens Axboe *    to blk_queue_make_request().
86db1e29SJens Axboe *
86db1e29SJens Axboe * Caveat:
86db1e29SJens Axboe *    The driver that does this *must* be able to deal appropriately
86db1e29SJens Axboe *    with buffers in "highmemory". This can be accomplished by either calling
86db1e29SJens Axboe *    __bio_kmap_atomic() to get a temporary kernel mapping, or by calling
86db1e29SJens Axboe *    blk_queue_bounce() to create a buffer in normal memory.
86db1e29SJens Axboe **/
86db1e29SJens Axboevoid blk_queue_make_request(struct request_queue *q, make_request_fn *mfn)
86db1e29SJens Axboe{
86db1e29SJens Axboe	/*
86db1e29SJens Axboe	 * set defaults
86db1e29SJens Axboe	 */
86db1e29SJens Axboe	q->nr_requests = BLKDEV_MAX_RQ;
86db1e29SJens Axboe	blk_queue_max_phys_segments(q, MAX_PHYS_SEGMENTS);
86db1e29SJens Axboe	blk_queue_max_hw_segments(q, MAX_HW_SEGMENTS);
0e435ac2SMilan Broz	blk_queue_segment_boundary(q, BLK_SEG_BOUNDARY_MASK);
0e435ac2SMilan Broz	blk_queue_max_segment_size(q, MAX_SEGMENT_SIZE);
0e435ac2SMilan Broz
86db1e29SJens Axboe	q->make_request_fn = mfn;
6728cb0eSJens Axboe	q->backing_dev_info.ra_pages =
6728cb0eSJens Axboe			(VM_MAX_READAHEAD * 1024) / PAGE_CACHE_SIZE;
86db1e29SJens Axboe	q->backing_dev_info.state = 0;
86db1e29SJens Axboe	q->backing_dev_info.capabilities = BDI_CAP_MAP_COPY;
86db1e29SJens Axboe	blk_queue_max_sectors(q, SAFE_MAX_SECTORS);
e1defc4fSMartin K. Petersen	blk_queue_logical_block_size(q, 512);
86db1e29SJens Axboe	blk_queue_dma_alignment(q, 511);
86db1e29SJens Axboe	blk_queue_congestion_threshold(q);
86db1e29SJens Axboe	q->nr_batching = BLK_BATCH_REQ;
86db1e29SJens Axboe
86db1e29SJens Axboe	q->unplug_thresh = 4;		/* hmm */
86db1e29SJens Axboe	q->unplug_delay = (3 * HZ) / 1000;	/* 3 milliseconds */
86db1e29SJens Axboe	if (q->unplug_delay == 0)
86db1e29SJens Axboe		q->unplug_delay = 1;
86db1e29SJens Axboe
86db1e29SJens Axboe	q->unplug_timer.function = blk_unplug_timeout;
86db1e29SJens Axboe	q->unplug_timer.data = (unsigned long)q;
86db1e29SJens Axboe
86db1e29SJens Axboe	/*
86db1e29SJens Axboe	 * by default assume old behaviour and bounce for any highmem page
86db1e29SJens Axboe	 */
86db1e29SJens Axboe	blk_queue_bounce_limit(q, BLK_BOUNCE_HIGH);
86db1e29SJens Axboe}
86db1e29SJens AxboeEXPORT_SYMBOL(blk_queue_make_request);
86db1e29SJens Axboe
86db1e29SJens Axboe/**
86db1e29SJens Axboe * blk_queue_bounce_limit - set bounce buffer limit for queue
86db1e29SJens Axboe * @q: the request queue for the device
cd0aca2dSTejun Heo * @dma_mask: the maximum address the device can handle
86db1e29SJens Axboe *
86db1e29SJens Axboe * Description:
86db1e29SJens Axboe *    Different hardware can have different requirements as to what pages
86db1e29SJens Axboe *    it can do I/O directly to. A low level driver can call
86db1e29SJens Axboe *    blk_queue_bounce_limit to have lower memory pages allocated as bounce
cd0aca2dSTejun Heo *    buffers for doing I/O to pages residing above @dma_mask.
86db1e29SJens Axboe **/
cd0aca2dSTejun Heovoid blk_queue_bounce_limit(struct request_queue *q, u64 dma_mask)
86db1e29SJens Axboe{
cd0aca2dSTejun Heo	unsigned long b_pfn = dma_mask >> PAGE_SHIFT;
86db1e29SJens Axboe	int dma = 0;
86db1e29SJens Axboe
86db1e29SJens Axboe	q->bounce_gfp = GFP_NOIO;
86db1e29SJens Axboe#if BITS_PER_LONG == 64
cd0aca2dSTejun Heo	/*
cd0aca2dSTejun Heo	 * Assume anything <= 4GB can be handled by IOMMU.  Actually
cd0aca2dSTejun Heo	 * some IOMMUs can handle everything, but I don't know of a
cd0aca2dSTejun Heo	 * way to test this here.
cd0aca2dSTejun Heo	 */
cd0aca2dSTejun Heo	if (b_pfn < (min_t(u64, 0xffffffffUL, BLK_BOUNCE_HIGH) >> PAGE_SHIFT))
86db1e29SJens Axboe		dma = 1;
025146e1SMartin K. Petersen	q->limits.bounce_pfn = max_low_pfn;
86db1e29SJens Axboe#else
6728cb0eSJens Axboe	if (b_pfn < blk_max_low_pfn)
86db1e29SJens Axboe		dma = 1;
025146e1SMartin K. Petersen	q->limits.bounce_pfn = b_pfn;
86db1e29SJens Axboe#endif
86db1e29SJens Axboe	if (dma) {
86db1e29SJens Axboe		init_emergency_isa_pool();
86db1e29SJens Axboe		q->bounce_gfp = GFP_NOIO | GFP_DMA;
025146e1SMartin K. Petersen		q->limits.bounce_pfn = b_pfn;
86db1e29SJens Axboe	}
86db1e29SJens Axboe}
86db1e29SJens AxboeEXPORT_SYMBOL(blk_queue_bounce_limit);
86db1e29SJens Axboe
86db1e29SJens Axboe/**
86db1e29SJens Axboe * blk_queue_max_sectors - set max sectors for a request for this queue
86db1e29SJens Axboe * @q:  the request queue for the device
86db1e29SJens Axboe * @max_sectors:  max sectors in the usual 512b unit
86db1e29SJens Axboe *
86db1e29SJens Axboe * Description:
86db1e29SJens Axboe *    Enables a low level driver to set an upper limit on the size of
86db1e29SJens Axboe *    received requests.
86db1e29SJens Axboe **/
86db1e29SJens Axboevoid blk_queue_max_sectors(struct request_queue *q, unsigned int max_sectors)
86db1e29SJens Axboe{
86db1e29SJens Axboe	if ((max_sectors << 9) < PAGE_CACHE_SIZE) {
86db1e29SJens Axboe		max_sectors = 1 << (PAGE_CACHE_SHIFT - 9);
24c03d47SHarvey Harrison		printk(KERN_INFO "%s: set to minimum %d\n",
24c03d47SHarvey Harrison		       __func__, max_sectors);
86db1e29SJens Axboe	}
86db1e29SJens Axboe
86db1e29SJens Axboe	if (BLK_DEF_MAX_SECTORS > max_sectors)
025146e1SMartin K. Petersen		q->limits.max_hw_sectors = q->limits.max_sectors = max_sectors;
86db1e29SJens Axboe	else {
025146e1SMartin K. Petersen		q->limits.max_sectors = BLK_DEF_MAX_SECTORS;
025146e1SMartin K. Petersen		q->limits.max_hw_sectors = max_sectors;
86db1e29SJens Axboe	}
86db1e29SJens Axboe}
86db1e29SJens AxboeEXPORT_SYMBOL(blk_queue_max_sectors);
86db1e29SJens Axboe
ae03bf63SMartin K. Petersenvoid blk_queue_max_hw_sectors(struct request_queue *q, unsigned int max_sectors)
ae03bf63SMartin K. Petersen{
ae03bf63SMartin K. Petersen	if (BLK_DEF_MAX_SECTORS > max_sectors)
025146e1SMartin K. Petersen		q->limits.max_hw_sectors = BLK_DEF_MAX_SECTORS;
ae03bf63SMartin K. Petersen	else
025146e1SMartin K. Petersen		q->limits.max_hw_sectors = max_sectors;
ae03bf63SMartin K. Petersen}
ae03bf63SMartin K. PetersenEXPORT_SYMBOL(blk_queue_max_hw_sectors);
ae03bf63SMartin K. Petersen
86db1e29SJens Axboe/**
86db1e29SJens Axboe * blk_queue_max_phys_segments - set max phys segments for a request for this queue
86db1e29SJens Axboe * @q:  the request queue for the device
86db1e29SJens Axboe * @max_segments:  max number of segments
86db1e29SJens Axboe *
86db1e29SJens Axboe * Description:
86db1e29SJens Axboe *    Enables a low level driver to set an upper limit on the number of
86db1e29SJens Axboe *    physical data segments in a request.  This would be the largest sized
86db1e29SJens Axboe *    scatter list the driver could handle.
86db1e29SJens Axboe **/
86db1e29SJens Axboevoid blk_queue_max_phys_segments(struct request_queue *q,
86db1e29SJens Axboe				 unsigned short max_segments)
86db1e29SJens Axboe{
86db1e29SJens Axboe	if (!max_segments) {
86db1e29SJens Axboe		max_segments = 1;
24c03d47SHarvey Harrison		printk(KERN_INFO "%s: set to minimum %d\n",
24c03d47SHarvey Harrison		       __func__, max_segments);
86db1e29SJens Axboe	}
86db1e29SJens Axboe
025146e1SMartin K. Petersen	q->limits.max_phys_segments = max_segments;
86db1e29SJens Axboe}
86db1e29SJens AxboeEXPORT_SYMBOL(blk_queue_max_phys_segments);
86db1e29SJens Axboe
86db1e29SJens Axboe/**
86db1e29SJens Axboe * blk_queue_max_hw_segments - set max hw segments for a request for this queue
86db1e29SJens Axboe * @q:  the request queue for the device
86db1e29SJens Axboe * @max_segments:  max number of segments
86db1e29SJens Axboe *
86db1e29SJens Axboe * Description:
86db1e29SJens Axboe *    Enables a low level driver to set an upper limit on the number of
86db1e29SJens Axboe *    hw data segments in a request.  This would be the largest number of
710027a4SRandy Dunlap *    address/length pairs the host adapter can actually give at once
86db1e29SJens Axboe *    to the device.
86db1e29SJens Axboe **/
86db1e29SJens Axboevoid blk_queue_max_hw_segments(struct request_queue *q,
86db1e29SJens Axboe			       unsigned short max_segments)
86db1e29SJens Axboe{
86db1e29SJens Axboe	if (!max_segments) {
86db1e29SJens Axboe		max_segments = 1;
24c03d47SHarvey Harrison		printk(KERN_INFO "%s: set to minimum %d\n",
24c03d47SHarvey Harrison		       __func__, max_segments);
86db1e29SJens Axboe	}
86db1e29SJens Axboe
025146e1SMartin K. Petersen	q->limits.max_hw_segments = max_segments;
86db1e29SJens Axboe}
86db1e29SJens AxboeEXPORT_SYMBOL(blk_queue_max_hw_segments);
86db1e29SJens Axboe
86db1e29SJens Axboe/**
86db1e29SJens Axboe * blk_queue_max_segment_size - set max segment size for blk_rq_map_sg
86db1e29SJens Axboe * @q:  the request queue for the device
86db1e29SJens Axboe * @max_size:  max size of segment in bytes
86db1e29SJens Axboe *
86db1e29SJens Axboe * Description:
86db1e29SJens Axboe *    Enables a low level driver to set an upper limit on the size of a
86db1e29SJens Axboe *    coalesced segment
86db1e29SJens Axboe **/
86db1e29SJens Axboevoid blk_queue_max_segment_size(struct request_queue *q, unsigned int max_size)
86db1e29SJens Axboe{
86db1e29SJens Axboe	if (max_size < PAGE_CACHE_SIZE) {
86db1e29SJens Axboe		max_size = PAGE_CACHE_SIZE;
24c03d47SHarvey Harrison		printk(KERN_INFO "%s: set to minimum %d\n",
24c03d47SHarvey Harrison		       __func__, max_size);
86db1e29SJens Axboe	}
86db1e29SJens Axboe
025146e1SMartin K. Petersen	q->limits.max_segment_size = max_size;
86db1e29SJens Axboe}
86db1e29SJens AxboeEXPORT_SYMBOL(blk_queue_max_segment_size);
86db1e29SJens Axboe
86db1e29SJens Axboe/**
e1defc4fSMartin K. Petersen * blk_queue_logical_block_size - set logical block size for the queue
86db1e29SJens Axboe * @q:  the request queue for the device
e1defc4fSMartin K. Petersen * @size:  the logical block size, in bytes
86db1e29SJens Axboe *
86db1e29SJens Axboe * Description:
e1defc4fSMartin K. Petersen *   This should be set to the lowest possible block size that the
e1defc4fSMartin K. Petersen *   storage device can address.  The default of 512 covers most
e1defc4fSMartin K. Petersen *   hardware.
86db1e29SJens Axboe **/
e1defc4fSMartin K. Petersenvoid blk_queue_logical_block_size(struct request_queue *q, unsigned short size)
86db1e29SJens Axboe{
025146e1SMartin K. Petersen	q->limits.logical_block_size = size;
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	if (q->limits.physical_block_size < size)
*c72758f3SMartin K. Petersen		q->limits.physical_block_size = size;
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	if (q->limits.io_min < q->limits.physical_block_size)
*c72758f3SMartin K. Petersen		q->limits.io_min = q->limits.physical_block_size;
86db1e29SJens Axboe}
e1defc4fSMartin K. PetersenEXPORT_SYMBOL(blk_queue_logical_block_size);
86db1e29SJens Axboe
*c72758f3SMartin K. Petersen/**
*c72758f3SMartin K. Petersen * blk_queue_physical_block_size - set physical block size for the queue
*c72758f3SMartin K. Petersen * @q:  the request queue for the device
*c72758f3SMartin K. Petersen * @size:  the physical block size, in bytes
*c72758f3SMartin K. Petersen *
*c72758f3SMartin K. Petersen * Description:
*c72758f3SMartin K. Petersen *   This should be set to the lowest possible sector size that the
*c72758f3SMartin K. Petersen *   hardware can operate on without reverting to read-modify-write
*c72758f3SMartin K. Petersen *   operations.
*c72758f3SMartin K. Petersen */
*c72758f3SMartin K. Petersenvoid blk_queue_physical_block_size(struct request_queue *q, unsigned short size)
*c72758f3SMartin K. Petersen{
*c72758f3SMartin K. Petersen	q->limits.physical_block_size = size;
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	if (q->limits.physical_block_size < q->limits.logical_block_size)
*c72758f3SMartin K. Petersen		q->limits.physical_block_size = q->limits.logical_block_size;
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	if (q->limits.io_min < q->limits.physical_block_size)
*c72758f3SMartin K. Petersen		q->limits.io_min = q->limits.physical_block_size;
*c72758f3SMartin K. Petersen}
*c72758f3SMartin K. PetersenEXPORT_SYMBOL(blk_queue_physical_block_size);
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen/**
*c72758f3SMartin K. Petersen * blk_queue_alignment_offset - set physical block alignment offset
*c72758f3SMartin K. Petersen * @q:	the request queue for the device
*c72758f3SMartin K. Petersen * @alignment:	alignment offset in bytes
*c72758f3SMartin K. Petersen *
*c72758f3SMartin K. Petersen * Description:
*c72758f3SMartin K. Petersen *   Some devices are naturally misaligned to compensate for things like
*c72758f3SMartin K. Petersen *   the legacy DOS partition table 63-sector offset.  Low-level drivers
*c72758f3SMartin K. Petersen *   should call this function for devices whose first sector is not
*c72758f3SMartin K. Petersen *   naturally aligned.
*c72758f3SMartin K. Petersen */
*c72758f3SMartin K. Petersenvoid blk_queue_alignment_offset(struct request_queue *q, unsigned int offset)
*c72758f3SMartin K. Petersen{
*c72758f3SMartin K. Petersen	q->limits.alignment_offset =
*c72758f3SMartin K. Petersen		offset & (q->limits.physical_block_size - 1);
*c72758f3SMartin K. Petersen	q->limits.misaligned = 0;
*c72758f3SMartin K. Petersen}
*c72758f3SMartin K. PetersenEXPORT_SYMBOL(blk_queue_alignment_offset);
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen/**
*c72758f3SMartin K. Petersen * blk_queue_io_min - set minimum request size for the queue
*c72758f3SMartin K. Petersen * @q:	the request queue for the device
*c72758f3SMartin K. Petersen * @io_min:  smallest I/O size in bytes
*c72758f3SMartin K. Petersen *
*c72758f3SMartin K. Petersen * Description:
*c72758f3SMartin K. Petersen *   Some devices have an internal block size bigger than the reported
*c72758f3SMartin K. Petersen *   hardware sector size.  This function can be used to signal the
*c72758f3SMartin K. Petersen *   smallest I/O the device can perform without incurring a performance
*c72758f3SMartin K. Petersen *   penalty.
*c72758f3SMartin K. Petersen */
*c72758f3SMartin K. Petersenvoid blk_queue_io_min(struct request_queue *q, unsigned int min)
*c72758f3SMartin K. Petersen{
*c72758f3SMartin K. Petersen	q->limits.io_min = min;
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	if (q->limits.io_min < q->limits.logical_block_size)
*c72758f3SMartin K. Petersen		q->limits.io_min = q->limits.logical_block_size;
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	if (q->limits.io_min < q->limits.physical_block_size)
*c72758f3SMartin K. Petersen		q->limits.io_min = q->limits.physical_block_size;
*c72758f3SMartin K. Petersen}
*c72758f3SMartin K. PetersenEXPORT_SYMBOL(blk_queue_io_min);
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen/**
*c72758f3SMartin K. Petersen * blk_queue_io_opt - set optimal request size for the queue
*c72758f3SMartin K. Petersen * @q:	the request queue for the device
*c72758f3SMartin K. Petersen * @io_opt:  optimal request size in bytes
*c72758f3SMartin K. Petersen *
*c72758f3SMartin K. Petersen * Description:
*c72758f3SMartin K. Petersen *   Drivers can call this function to set the preferred I/O request
*c72758f3SMartin K. Petersen *   size for devices that report such a value.
*c72758f3SMartin K. Petersen */
*c72758f3SMartin K. Petersenvoid blk_queue_io_opt(struct request_queue *q, unsigned int opt)
*c72758f3SMartin K. Petersen{
*c72758f3SMartin K. Petersen	q->limits.io_opt = opt;
*c72758f3SMartin K. Petersen}
*c72758f3SMartin K. PetersenEXPORT_SYMBOL(blk_queue_io_opt);
*c72758f3SMartin K. Petersen
86db1e29SJens Axboe/*
86db1e29SJens Axboe * Returns the minimum that is _not_ zero, unless both are zero.
86db1e29SJens Axboe */
86db1e29SJens Axboe#define min_not_zero(l, r) (l == 0) ? r : ((r == 0) ? l : min(l, r))
86db1e29SJens Axboe
86db1e29SJens Axboe/**
86db1e29SJens Axboe * blk_queue_stack_limits - inherit underlying queue limits for stacked drivers
86db1e29SJens Axboe * @t:	the stacking driver (top)
86db1e29SJens Axboe * @b:  the underlying device (bottom)
86db1e29SJens Axboe **/
86db1e29SJens Axboevoid blk_queue_stack_limits(struct request_queue *t, struct request_queue *b)
86db1e29SJens Axboe{
86db1e29SJens Axboe	/* zero is "infinity" */
025146e1SMartin K. Petersen	t->limits.max_sectors = min_not_zero(queue_max_sectors(t),
025146e1SMartin K. Petersen					     queue_max_sectors(b));
86db1e29SJens Axboe
025146e1SMartin K. Petersen	t->limits.max_hw_sectors = min_not_zero(queue_max_hw_sectors(t),
025146e1SMartin K. Petersen						queue_max_hw_sectors(b));
025146e1SMartin K. Petersen
025146e1SMartin K. Petersen	t->limits.seg_boundary_mask = min_not_zero(queue_segment_boundary(t),
025146e1SMartin K. Petersen						   queue_segment_boundary(b));
025146e1SMartin K. Petersen
025146e1SMartin K. Petersen	t->limits.max_phys_segments = min_not_zero(queue_max_phys_segments(t),
025146e1SMartin K. Petersen						   queue_max_phys_segments(b));
025146e1SMartin K. Petersen
025146e1SMartin K. Petersen	t->limits.max_hw_segments = min_not_zero(queue_max_hw_segments(t),
025146e1SMartin K. Petersen						 queue_max_hw_segments(b));
025146e1SMartin K. Petersen
025146e1SMartin K. Petersen	t->limits.max_segment_size = min_not_zero(queue_max_segment_size(t),
025146e1SMartin K. Petersen						  queue_max_segment_size(b));
025146e1SMartin K. Petersen
025146e1SMartin K. Petersen	t->limits.logical_block_size = max(queue_logical_block_size(t),
025146e1SMartin K. Petersen					   queue_logical_block_size(b));
025146e1SMartin K. Petersen
e7e72bf6SNeil Brown	if (!t->queue_lock)
e7e72bf6SNeil Brown		WARN_ON_ONCE(1);
e7e72bf6SNeil Brown	else if (!test_bit(QUEUE_FLAG_CLUSTER, &b->queue_flags)) {
e7e72bf6SNeil Brown		unsigned long flags;
e7e72bf6SNeil Brown		spin_lock_irqsave(t->queue_lock, flags);
75ad23bcSNick Piggin		queue_flag_clear(QUEUE_FLAG_CLUSTER, t);
e7e72bf6SNeil Brown		spin_unlock_irqrestore(t->queue_lock, flags);
e7e72bf6SNeil Brown	}
86db1e29SJens Axboe}
86db1e29SJens AxboeEXPORT_SYMBOL(blk_queue_stack_limits);
86db1e29SJens Axboe
86db1e29SJens Axboe/**
*c72758f3SMartin K. Petersen * blk_stack_limits - adjust queue_limits for stacked devices
*c72758f3SMartin K. Petersen * @t:	the stacking driver limits (top)
*c72758f3SMartin K. Petersen * @bdev:  the underlying queue limits (bottom)
*c72758f3SMartin K. Petersen * @offset:  offset to beginning of data within component device
*c72758f3SMartin K. Petersen *
*c72758f3SMartin K. Petersen * Description:
*c72758f3SMartin K. Petersen *    Merges two queue_limit structs.  Returns 0 if alignment didn't
*c72758f3SMartin K. Petersen *    change.  Returns -1 if adding the bottom device caused
*c72758f3SMartin K. Petersen *    misalignment.
*c72758f3SMartin K. Petersen */
*c72758f3SMartin K. Petersenint blk_stack_limits(struct queue_limits *t, struct queue_limits *b,
*c72758f3SMartin K. Petersen		     sector_t offset)
*c72758f3SMartin K. Petersen{
*c72758f3SMartin K. Petersen	t->max_sectors = min_not_zero(t->max_sectors, b->max_sectors);
*c72758f3SMartin K. Petersen	t->max_hw_sectors = min_not_zero(t->max_hw_sectors, b->max_hw_sectors);
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	t->seg_boundary_mask = min_not_zero(t->seg_boundary_mask,
*c72758f3SMartin K. Petersen					    b->seg_boundary_mask);
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	t->max_phys_segments = min_not_zero(t->max_phys_segments,
*c72758f3SMartin K. Petersen					    b->max_phys_segments);
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	t->max_hw_segments = min_not_zero(t->max_hw_segments,
*c72758f3SMartin K. Petersen					  b->max_hw_segments);
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	t->max_segment_size = min_not_zero(t->max_segment_size,
*c72758f3SMartin K. Petersen					   b->max_segment_size);
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	t->logical_block_size = max(t->logical_block_size,
*c72758f3SMartin K. Petersen				    b->logical_block_size);
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	t->physical_block_size = max(t->physical_block_size,
*c72758f3SMartin K. Petersen				     b->physical_block_size);
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	t->io_min = max(t->io_min, b->io_min);
*c72758f3SMartin K. Petersen	t->no_cluster |= b->no_cluster;
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	/* Bottom device offset aligned? */
*c72758f3SMartin K. Petersen	if (offset &&
*c72758f3SMartin K. Petersen	    (offset & (b->physical_block_size - 1)) != b->alignment_offset) {
*c72758f3SMartin K. Petersen		t->misaligned = 1;
*c72758f3SMartin K. Petersen		return -1;
*c72758f3SMartin K. Petersen	}
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	/* If top has no alignment offset, inherit from bottom */
*c72758f3SMartin K. Petersen	if (!t->alignment_offset)
*c72758f3SMartin K. Petersen		t->alignment_offset =
*c72758f3SMartin K. Petersen			b->alignment_offset & (b->physical_block_size - 1);
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	/* Top device aligned on logical block boundary? */
*c72758f3SMartin K. Petersen	if (t->alignment_offset & (t->logical_block_size - 1)) {
*c72758f3SMartin K. Petersen		t->misaligned = 1;
*c72758f3SMartin K. Petersen		return -1;
*c72758f3SMartin K. Petersen	}
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	return 0;
*c72758f3SMartin K. Petersen}
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen/**
*c72758f3SMartin K. Petersen * disk_stack_limits - adjust queue limits for stacked drivers
*c72758f3SMartin K. Petersen * @t:	MD/DM gendisk (top)
*c72758f3SMartin K. Petersen * @bdev:  the underlying block device (bottom)
*c72758f3SMartin K. Petersen * @offset:  offset to beginning of data within component device
*c72758f3SMartin K. Petersen *
*c72758f3SMartin K. Petersen * Description:
*c72758f3SMartin K. Petersen *    Merges the limits for two queues.  Returns 0 if alignment
*c72758f3SMartin K. Petersen *    didn't change.  Returns -1 if adding the bottom device caused
*c72758f3SMartin K. Petersen *    misalignment.
*c72758f3SMartin K. Petersen */
*c72758f3SMartin K. Petersenvoid disk_stack_limits(struct gendisk *disk, struct block_device *bdev,
*c72758f3SMartin K. Petersen		       sector_t offset)
*c72758f3SMartin K. Petersen{
*c72758f3SMartin K. Petersen	struct request_queue *t = disk->queue;
*c72758f3SMartin K. Petersen	struct request_queue *b = bdev_get_queue(bdev);
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	offset += get_start_sect(bdev) << 9;
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	if (blk_stack_limits(&t->limits, &b->limits, offset) < 0) {
*c72758f3SMartin K. Petersen		char top[BDEVNAME_SIZE], bottom[BDEVNAME_SIZE];
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen		disk_name(disk, 0, top);
*c72758f3SMartin K. Petersen		bdevname(bdev, bottom);
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen		printk(KERN_NOTICE "%s: Warning: Device %s is misaligned\n",
*c72758f3SMartin K. Petersen		       top, bottom);
*c72758f3SMartin K. Petersen	}
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen	if (!t->queue_lock)
*c72758f3SMartin K. Petersen		WARN_ON_ONCE(1);
*c72758f3SMartin K. Petersen	else if (!test_bit(QUEUE_FLAG_CLUSTER, &b->queue_flags)) {
*c72758f3SMartin K. Petersen		unsigned long flags;
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen		spin_lock_irqsave(t->queue_lock, flags);
*c72758f3SMartin K. Petersen		if (!test_bit(QUEUE_FLAG_CLUSTER, &b->queue_flags))
*c72758f3SMartin K. Petersen			queue_flag_clear(QUEUE_FLAG_CLUSTER, t);
*c72758f3SMartin K. Petersen		spin_unlock_irqrestore(t->queue_lock, flags);
*c72758f3SMartin K. Petersen	}
*c72758f3SMartin K. Petersen}
*c72758f3SMartin K. PetersenEXPORT_SYMBOL(disk_stack_limits);
*c72758f3SMartin K. Petersen
*c72758f3SMartin K. Petersen/**
e3790c7dSTejun Heo * blk_queue_dma_pad - set pad mask
e3790c7dSTejun Heo * @q:     the request queue for the device
e3790c7dSTejun Heo * @mask:  pad mask
e3790c7dSTejun Heo *
27f8221aSFUJITA Tomonori * Set dma pad mask.
e3790c7dSTejun Heo *
27f8221aSFUJITA Tomonori * Appending pad buffer to a request modifies the last entry of a
27f8221aSFUJITA Tomonori * scatter list such that it includes the pad buffer.
e3790c7dSTejun Heo **/
e3790c7dSTejun Heovoid blk_queue_dma_pad(struct request_queue *q, unsigned int mask)
e3790c7dSTejun Heo{
e3790c7dSTejun Heo	q->dma_pad_mask = mask;
e3790c7dSTejun Heo}
e3790c7dSTejun HeoEXPORT_SYMBOL(blk_queue_dma_pad);
e3790c7dSTejun Heo
e3790c7dSTejun Heo/**
27f8221aSFUJITA Tomonori * blk_queue_update_dma_pad - update pad mask
27f8221aSFUJITA Tomonori * @q:     the request queue for the device
27f8221aSFUJITA Tomonori * @mask:  pad mask
27f8221aSFUJITA Tomonori *
27f8221aSFUJITA Tomonori * Update dma pad mask.
27f8221aSFUJITA Tomonori *
27f8221aSFUJITA Tomonori * Appending pad buffer to a request modifies the last entry of a
27f8221aSFUJITA Tomonori * scatter list such that it includes the pad buffer.
27f8221aSFUJITA Tomonori **/
27f8221aSFUJITA Tomonorivoid blk_queue_update_dma_pad(struct request_queue *q, unsigned int mask)
27f8221aSFUJITA Tomonori{
27f8221aSFUJITA Tomonori	if (mask > q->dma_pad_mask)
27f8221aSFUJITA Tomonori		q->dma_pad_mask = mask;
27f8221aSFUJITA Tomonori}
27f8221aSFUJITA TomonoriEXPORT_SYMBOL(blk_queue_update_dma_pad);
27f8221aSFUJITA Tomonori
27f8221aSFUJITA Tomonori/**
86db1e29SJens Axboe * blk_queue_dma_drain - Set up a drain buffer for excess dma.
86db1e29SJens Axboe * @q:  the request queue for the device
2fb98e84STejun Heo * @dma_drain_needed: fn which returns non-zero if drain is necessary
86db1e29SJens Axboe * @buf:	physically contiguous buffer
86db1e29SJens Axboe * @size:	size of the buffer in bytes
86db1e29SJens Axboe *
86db1e29SJens Axboe * Some devices have excess DMA problems and can't simply discard (or
86db1e29SJens Axboe * zero fill) the unwanted piece of the transfer.  They have to have a
86db1e29SJens Axboe * real area of memory to transfer it into.  The use case for this is
86db1e29SJens Axboe * ATAPI devices in DMA mode.  If the packet command causes a transfer
86db1e29SJens Axboe * bigger than the transfer size some HBAs will lock up if there
86db1e29SJens Axboe * aren't DMA elements to contain the excess transfer.  What this API
86db1e29SJens Axboe * does is adjust the queue so that the buf is always appended
86db1e29SJens Axboe * silently to the scatterlist.
86db1e29SJens Axboe *
86db1e29SJens Axboe * Note: This routine adjusts max_hw_segments to make room for
86db1e29SJens Axboe * appending the drain buffer.  If you call
86db1e29SJens Axboe * blk_queue_max_hw_segments() or blk_queue_max_phys_segments() after
86db1e29SJens Axboe * calling this routine, you must set the limit to one fewer than your
86db1e29SJens Axboe * device can support otherwise there won't be room for the drain
86db1e29SJens Axboe * buffer.
86db1e29SJens Axboe */
448da4d2SHarvey Harrisonint blk_queue_dma_drain(struct request_queue *q,
2fb98e84STejun Heo			       dma_drain_needed_fn *dma_drain_needed,
2fb98e84STejun Heo			       void *buf, unsigned int size)
86db1e29SJens Axboe{
ae03bf63SMartin K. Petersen	if (queue_max_hw_segments(q) < 2 || queue_max_phys_segments(q) < 2)
86db1e29SJens Axboe		return -EINVAL;
86db1e29SJens Axboe	/* make room for appending the drain */
ae03bf63SMartin K. Petersen	blk_queue_max_hw_segments(q, queue_max_hw_segments(q) - 1);
ae03bf63SMartin K. Petersen	blk_queue_max_phys_segments(q, queue_max_phys_segments(q) - 1);
2fb98e84STejun Heo	q->dma_drain_needed = dma_drain_needed;
86db1e29SJens Axboe	q->dma_drain_buffer = buf;
86db1e29SJens Axboe	q->dma_drain_size = size;
86db1e29SJens Axboe
86db1e29SJens Axboe	return 0;
86db1e29SJens Axboe}
86db1e29SJens AxboeEXPORT_SYMBOL_GPL(blk_queue_dma_drain);
86db1e29SJens Axboe
86db1e29SJens Axboe/**
86db1e29SJens Axboe * blk_queue_segment_boundary - set boundary rules for segment merging
86db1e29SJens Axboe * @q:  the request queue for the device
86db1e29SJens Axboe * @mask:  the memory boundary mask
86db1e29SJens Axboe **/
86db1e29SJens Axboevoid blk_queue_segment_boundary(struct request_queue *q, unsigned long mask)
86db1e29SJens Axboe{
86db1e29SJens Axboe	if (mask < PAGE_CACHE_SIZE - 1) {
86db1e29SJens Axboe		mask = PAGE_CACHE_SIZE - 1;
24c03d47SHarvey Harrison		printk(KERN_INFO "%s: set to minimum %lx\n",
24c03d47SHarvey Harrison		       __func__, mask);
86db1e29SJens Axboe	}
86db1e29SJens Axboe
025146e1SMartin K. Petersen	q->limits.seg_boundary_mask = mask;
86db1e29SJens Axboe}
86db1e29SJens AxboeEXPORT_SYMBOL(blk_queue_segment_boundary);
86db1e29SJens Axboe
86db1e29SJens Axboe/**
86db1e29SJens Axboe * blk_queue_dma_alignment - set dma length and memory alignment
86db1e29SJens Axboe * @q:     the request queue for the device
86db1e29SJens Axboe * @mask:  alignment mask
86db1e29SJens Axboe *
86db1e29SJens Axboe * description:
710027a4SRandy Dunlap *    set required memory and length alignment for direct dma transactions.
8feb4d20SAlan Cox *    this is used when building direct io requests for the queue.
86db1e29SJens Axboe *
86db1e29SJens Axboe **/
86db1e29SJens Axboevoid blk_queue_dma_alignment(struct request_queue *q, int mask)
86db1e29SJens Axboe{
86db1e29SJens Axboe	q->dma_alignment = mask;
86db1e29SJens Axboe}
86db1e29SJens AxboeEXPORT_SYMBOL(blk_queue_dma_alignment);
86db1e29SJens Axboe
86db1e29SJens Axboe/**
86db1e29SJens Axboe * blk_queue_update_dma_alignment - update dma length and memory alignment
86db1e29SJens Axboe * @q:     the request queue for the device
86db1e29SJens Axboe * @mask:  alignment mask
86db1e29SJens Axboe *
86db1e29SJens Axboe * description:
710027a4SRandy Dunlap *    update required memory and length alignment for direct dma transactions.
86db1e29SJens Axboe *    If the requested alignment is larger than the current alignment, then
86db1e29SJens Axboe *    the current queue alignment is updated to the new value, otherwise it
86db1e29SJens Axboe *    is left alone.  The design of this is to allow multiple objects
86db1e29SJens Axboe *    (driver, device, transport etc) to set their respective
86db1e29SJens Axboe *    alignments without having them interfere.
86db1e29SJens Axboe *
86db1e29SJens Axboe **/
86db1e29SJens Axboevoid blk_queue_update_dma_alignment(struct request_queue *q, int mask)
86db1e29SJens Axboe{
86db1e29SJens Axboe	BUG_ON(mask > PAGE_SIZE);
86db1e29SJens Axboe
86db1e29SJens Axboe	if (mask > q->dma_alignment)
86db1e29SJens Axboe		q->dma_alignment = mask;
86db1e29SJens Axboe}
86db1e29SJens AxboeEXPORT_SYMBOL(blk_queue_update_dma_alignment);
86db1e29SJens Axboe
aeb3d3a8SHarvey Harrisonstatic int __init blk_settings_init(void)
86db1e29SJens Axboe{
86db1e29SJens Axboe	blk_max_low_pfn = max_low_pfn - 1;
86db1e29SJens Axboe	blk_max_pfn = max_pfn - 1;
86db1e29SJens Axboe	return 0;
86db1e29SJens Axboe}
86db1e29SJens Axboesubsys_initcall(blk_settings_init);